百度推“DeepVoice”最終版:半小時即可學(xué)會一種口音
最近,百度終于推出了DeepVoice的“最終版”,并聲稱最終版可以在每半個小時內(nèi)完成對10000種語音的數(shù)據(jù)學(xué)習(xí)。
DeepVoice作為一個完全有深度神經(jīng)網(wǎng)絡(luò)構(gòu)建的高質(zhì)量語音轉(zhuǎn)文本系統(tǒng),能夠用于智能手機(jī)地圖與語音軟件;能夠?qū)崿F(xiàn)游戲角色由玩家自己合成聲音,從而替代原聲配音;還能夠用于音樂合成供娛樂消遣。但目前百度DeepVoice產(chǎn)出的口音,其合成感還是很明顯。
百度于今年2月份推出的DeepVoice第一代,與神經(jīng)文本到語音(TTS)系統(tǒng)不同,它只能學(xué)習(xí)較短的句子,并且系統(tǒng)每次只能學(xué)習(xí)一種聲音,在數(shù)個小時后才能掌握。
在今年5月份推出的DeepVoice2,模仿口音時間有所提高,大約一個小時內(nèi)即可模仿出一種口音。單系統(tǒng)即可以學(xué)習(xí)數(shù)百種不同的口音,同時實現(xiàn)高音質(zhì)。
如今推出的DeepVoice最終版,效率極大提高,可以在半個小時內(nèi)完成對10000種語音數(shù)據(jù)的學(xué)習(xí)。但是,百度表示“最終版”仍然有進(jìn)步空間,他們要制造出一種能夠掌握多種口音或能捕捉字符間細(xì)微差別的系統(tǒng),以使得語音合成系統(tǒng)用處更廣泛,學(xué)習(xí)聲音真實程度更高,錯誤率降低。
除了百度之外,Google、Apple和Amazon都有相關(guān)的語音合成研發(fā)產(chǎn)品。Google旗下的DeepMind,一直在進(jìn)行一個名叫WaveNet的類似項目。最新版本的WaveNet已經(jīng)能夠在掌握口音方面做到真實、高效,甚至可以像真人那樣產(chǎn)生“唇音”?梢姡俣鹊恼Z音合成軟件的研發(fā)之路還很長遠(yuǎn)。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
8月5日立即報名>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
-
8月14日立即報名>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
精彩回顧立即查看>> OFweek 2025 具身機(jī)器人動力電池技術(shù)應(yīng)用大會
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進(jìn)化