從語音識別到語義識別,中間還有多長的路要走?
單通道和多人會話
一個好的會話語音識別器必須能夠根據(jù)誰在說話對音頻進行劃分,還應(yīng)該能弄清重疊的會話(聲源分離)來理解音頻。
一個人在一個有多個人說話的環(huán)境中的時候,能夠很容易的分辨出自己要與某人說話,并且能夠在同時與多個人交談。很明顯,目前的語音識別器并不能做到這一點。當多個人對著麥克風講話時,它可能直接就“懵”了。
上下文理解
實際生活中我們會使用許多其他的線索來輔助理解別人在說什么。
列舉幾個人類使用上下文而語音識別器沒有的情況:
歷史會話和討論過的話題;
說話人的視覺暗示,包括面部表情和嘴唇動作;
關(guān)于會話者的背景。
可以看到雖然目前語音識別技術(shù)的誤字率已經(jīng)低于5%,但想從語音識別轉(zhuǎn)變成真正的語義識別,是仍然面臨著很多挑戰(zhàn)。
語音識別到真正的語義識別
語音識別和語義識別合起來的語言識別雖然為人工智能的一大支系,但是比起語音識別,顯然語義識別要更加智能。在這里,與非網(wǎng)小編先給大家梳理一下人工智能,機器學習,深度學習,神經(jīng)網(wǎng)絡(luò)這些術(shù)語之間的關(guān)系,大家或許就更加能理解從語音識別到真正的語義識別還有哪些路要走(目前市場上有很多做語義識別的公司,但是跟人類相比還存在一定的距離。)?
人工智能(AI)是一個大的概念,它是機器學習的父類。
除學習之外的人工智能可以歸納成了“邏輯/算法編程”,也就是通過編程將人類所知的知識和邏輯告訴機器,從而借助機器的高速計算和海量存儲等能力實現(xiàn)一些人類才能做的“弱智能”工作,像上世紀深藍計算機,將國際象棋中所有可能的結(jié)果都通過預(yù)先編好的程序計算出來從而選擇最佳的下法(窮舉法)。從程序的實現(xiàn)上來說恐怕就是無數(shù)的if…else…吧。
而另一類就是基于數(shù)據(jù)的自我學習,把大量的數(shù)據(jù)告訴機器由機器自己去分析這些數(shù)據(jù)從而總結(jié)得出某種規(guī)律/邏輯,然后利用這種邏輯來處理新的數(shù)據(jù)。
毫無疑問,學習是人工智能中最為火熱和最有前途的方向,讓人去“學習”那么復(fù)雜的邏輯來告訴機器怎么做還不如讓機器自己來學習呢,畢竟人都是懶的嘛,而“懶”就是人類進步的動力!
學習是不斷的訓練過程,其模型是在連續(xù)的優(yōu)化調(diào)整中,隨著訓練數(shù)據(jù)越多其模型越準確,但是人類的學習不僅僅是一個連續(xù)學習過程,還有一種跳躍式學習,也就是常說的“頓悟”,這點是機器學習目前所沒有的。
也就是說,要從語音識別成功轉(zhuǎn)變成真正意義上的語義識別,首先要獲得大量的數(shù)據(jù)(比如說普通話,上海方言等),用過這些數(shù)據(jù)不斷訓練,來提高識別的準確率。
圖|語義識別市場
雖說實現(xiàn)真正的語義識別不容易,但是就目前的市場分析來看,語義識別已經(jīng)滲透到了我們的生活之中,作為人工智能的基礎(chǔ)性技術(shù)之一,隨著技術(shù)的不斷成熟,語義識別將不斷地改變更多的傳統(tǒng)行業(yè)。
圖|人工智能各分支占比
在人工智能的整個領(lǐng)域里,自然語言處理無論是在創(chuàng)業(yè)熱度/獲投數(shù)量還是獲投金額都處于細分領(lǐng)域的前三名。據(jù)有關(guān)數(shù)據(jù)分析,預(yù)計到2024年,市場規(guī)?蛇_110億美元。并且在這個領(lǐng)域還沒有出現(xiàn)巨頭,這塊蛋糕還給創(chuàng)業(yè)者留有大量的余地?梢哉f語音識別(在這里指的整個語言識別)未來的市場發(fā)展十分有看頭。
想象一下,當語音識別發(fā)展到一定程度,我們坐在電視機前就可以語音遙控想看的節(jié)目。假如你要看英劇《神探夏洛克》,經(jīng)常會被人叫成《神探夏洛特》(因為夏洛特更順嘴或者更普遍),這時候如果不做語義理解,可能你搜出來的名字就是《夏洛特煩惱》,因為它頻度也很高。
圖|語義識別帶來的人機交互
專做語義識別的三角獸公司CTO亓超對以上現(xiàn)象如此解釋:當你沒有辦法記住片子完整名字時,語義識別需要給你做糾正,做更合適處理。其實用戶在看電視產(chǎn)生很大需求,當用戶不知道要看什么,需要機器幫忙做推薦和引導,而這個過程中精準化程度、和人性化程度取決于智能化程度。
當語音識別發(fā)展到一定的程度,語義識別或?qū)⒊蔀樾碌闹髁鳌?/p>

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
8月5日立即報名>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
-
8月14日立即報名>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
精彩回顧立即查看>> OFweek 2025 具身機器人動力電池技術(shù)應(yīng)用大會
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機器人借殼上市,A股人形機器人第一股!
- 8 華為讓渡“三界”銷售主導權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進化