谷歌推出反應速度更快的語音助手,或?qū)⒋驍IRI和ALEXA
人們經(jīng)常向Siri和Alexa這樣的語音助手打招呼,讓語音助手來服務自己,但是語音助手可能會反應很慢,而且這種體驗可能也會時不時地出現(xiàn)故障。
周二,谷歌展示了一項新技術(shù),該技術(shù)能顯著提高語音識別的響應能力,這表明語音識別可能很快就會讓人無法抗拒。
在山景城的年度開發(fā)者大會上,谷歌吹噓其語音識別軟件縮小到其先前尺寸的1/25。首席執(zhí)行官Sundar Pichai稱這是一個里程碑,因為它意味著云服務器中的軟件可以安裝在Pixel智能手機中,使系統(tǒng)能夠更快地響應一個人的聲音。
在星期二的一系列演示中,谷歌展示的手機可以在發(fā)出聲音時識別文字,而不是將音頻發(fā)送到遠程服務器。更快的響應速度可能會改變?nèi)藗兣c手機的關系。在所示的一個場景中,谷歌的虛擬助手比Siri等競爭對手顯得更加強大。
在該演示中,谷歌員工梅吉·霍林格(Meggie Hollinger)展示了她如何能夠通過一系列語音命令輕松地在手機上完成工作。而且每一項都比Siri更快地完成。
為了向朋友發(fā)送最近一次假期的照片,霍林格只說了兩句話,三個短語:“給我看黃石公園照片,有關動物的,把它發(fā)給賈斯汀!睅酌腌娭畠(nèi),谷歌的照片應用程序搜索了她的收藏夾,并且顯示出一只野牛的照片。
谷歌人工智能首席執(zhí)行官杰夫迪恩在推特上表示這個語音識別功能會改變你與手機互動的方式。
現(xiàn)代語音助手是2012年人工智能研究的產(chǎn)物,這表明深度學習技術(shù)可以使語音識別更加準確。谷歌表示,該技術(shù)將錯誤率降低了25%。但是,向云端發(fā)送音頻會限制速度,并由于網(wǎng)絡錯誤而產(chǎn)生故障。
谷歌花了數(shù)年時間研究如何縮小深度學習軟件,并在2019年將其語音識別模型降至一個很低的門檻。
該公司周二表示,最新版本的谷歌云端服務器語音識別軟件包的大小約為2千兆字節(jié),而且可以在智能手機上運行。
語音識別明顯比第一代基于云的深度學習技術(shù)快得多,可能會促使用戶更頻繁地使用語音命令并查詢。它還可能使谷歌的設備和服務比蘋果和亞馬遜等競爭對手更加強大。
Gartner的研究主管Werner Goertz稱,轉(zhuǎn)向語音設備識別可能會改變游戲規(guī)則。這可能是蘋果和亞馬遜更傳統(tǒng)語音系統(tǒng)面臨的重大挑戰(zhàn)。
谷歌還利用其技術(shù)為其未來的手機Live Caption創(chuàng)建了一項新功能。激活后,屏幕上會顯示手機上播放的任何語音的字幕,例如來自朋友的視頻或播客。由于是在手機上進行的,因此即使在飛行模式下也能正常工作。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機器人借殼上市,A股人形機器人第一股!
- 8 華為讓渡“三界”銷售主導權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進化