北美首頁 | 新聞 | 時尚 | 大陸 | 臺灣 | 美國 | 娛樂 | 體育 | 財經 | 圖片 | 移民 | 微博 | 健康
美股佣金對照表
Value Engine Stock Forecast
ENTER SYMBOL(S)

直擊|阿里公佈新語音合成技術 錄音10分鐘定製AI語音

http://finance.sina.com   2019年07月09日 22:36   北京新浪網

  新浪科技訊 7月10日下午消息,阿里巴巴發佈新一代語音合成技術KAN-TTS,稱可大幅提高合成語音與真人發聲的相似度,並將語音合成定製成本降低10倍以上。該技術由達摩院機器智能實驗室自主研發。

  阿里方面稱,當前業界商用系統的合成語音與原始音頻錄音的接近程度通常在85%到90%之間,而基於KAN-TTS技術的合成語音可將該數據提高到97%以上。

  據悉,KAN-TTS由達摩院機器智能實驗室自主研發,深度融合了目前主流的端到端TTS技術和傳統TTS技術,從多個方面改進了語音合成。傳統語音合成定製需要10小時以上的數據錄製和標註,對錄音人和錄音環境要求很高。從啓動定製到最終交付,項目週期長成本高。

  阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結合的方法,將語音合成定製成本降低10倍以上,週期壓縮3倍以上。也就是說,用1小時有效錄音數據和不到兩個月製作週期,就能完成一次標準TTS定製。

  此外,這使得普通用戶定製“AI聲音”的門檻更低。只需手機錄音十分鐘,就能獲得與錄製聲音高度相似的合成語音。(韓大鵬)

Bookmark and Share
|
關閉
列印