思必馳打造高效率開會神器,智能降噪、遠(yuǎn)程流暢通話、音頻轉(zhuǎn)寫都是這樣實現(xiàn)的…
人工智能、云計算、物聯(lián)網(wǎng)等科技發(fā)展,企業(yè)紛紛進(jìn)行智能化戰(zhàn)略轉(zhuǎn)型和業(yè)務(wù)升級,開拓智能時代新藍(lán)海。智慧辦公作為AIoT升級和演進(jìn)方向之一,成為推動經(jīng)濟(jì)發(fā)展、轉(zhuǎn)型升級、社會進(jìn)步的重要驅(qū)動力量。
疫情讓辦公形式迎來多樣性的轉(zhuǎn)變。包括線上學(xué)習(xí)常常面臨準(zhǔn)確“記錄”聲音的困擾,因此拾音、降噪、轉(zhuǎn)寫等能力顯得格外重要。依托麥克風(fēng)陣列、智能降噪算法、長語音識別......思必馳目前已助力MAXHUB會議平板,飛利浦、紐曼、印象筆記、索尼等品牌錄音筆智能化升級。
AI加持,高效學(xué)習(xí)辦公
隨著人工智能在各行各業(yè)應(yīng)用深化,AI語音轉(zhuǎn)換文本市場規(guī)模空前。ReportLinker發(fā)布報告預(yù)計,到2027年,全球文本語音轉(zhuǎn)換市場規(guī)模將達(dá)到60億美元。其中,美國的文本語音轉(zhuǎn)換市場預(yù)計將達(dá)到6.013億美元。中國文本語音轉(zhuǎn)換市場規(guī)模將達(dá)到13億美元。
在AI加持下,錄音筆、手機(jī)、平板電腦等這些錄音設(shè)備早已不再只是單純的進(jìn)行音頻記錄,它們能直接將音頻轉(zhuǎn)寫成文字,還能對文字進(jìn)行編輯和處理,提升工作、學(xué)習(xí)效率。
眾多錄音設(shè)備中,最常見的是錄音筆。紐曼多款A(yù)I錄音筆采用思必馳智能錄音筆解決方案,錄音筆連接到手機(jī)端或PC,即可實現(xiàn)音頻轉(zhuǎn)寫、對話翻譯、空間及文本管理等多種功能。印象掃譯筆專業(yè)版(EverSCAN Pro)采用雙麥方案,搭載思必馳AI降噪算法,長語音識別,不同場景下對噪音進(jìn)行多重優(yōu)化,清晰降噪,實現(xiàn)長語音實時轉(zhuǎn)寫、錄音文件轉(zhuǎn)寫等功能。
索尼錄音筆、飛利浦錄音筆、MAXHUB會議平板等產(chǎn)品中目前均內(nèi)置了思必馳長語音識別服務(wù)。思必馳長語音識別服務(wù)支持實時識別與離線識別,識別準(zhǔn)確率可達(dá)98%(中國信息通信研究院檢測,報告編號:V21Y000005)。實時的錄音轉(zhuǎn)寫功能,無論上課、開會還是采訪,用戶都能快速準(zhǔn)確出稿,極大提升工作、學(xué)習(xí)效率。
遠(yuǎn)場+降噪,清晰自然交互
遠(yuǎn)程會議、線上學(xué)習(xí)場景,常常需要遠(yuǎn)場語音交互,并且伴隨著環(huán)境噪聲和人聲干擾。尤其在大型會議現(xiàn)場,遠(yuǎn)距離拾音和噪聲盡管不會掩蓋正常語音通話,但是影響了清晰度。
針對遠(yuǎn)場交互和噪聲問題,麥克風(fēng)陣列可以有效抑制噪聲。思必馳麥克風(fēng)陣列集成波束成形、回聲消除、聲源定位等算法,可拾取半徑5m內(nèi)的聲源,實現(xiàn)360°聲源定位,即使會議場景發(fā)言人之間遠(yuǎn)距離從多方位發(fā)聲,也可以輕松拾音。
另外,新一代的智能降噪技術(shù)也是文本語音轉(zhuǎn)寫的“法寶”。
傳統(tǒng)的噪音抑制方法只能作用于某些固定的穩(wěn)態(tài)噪音,如空調(diào)等電器的運轉(zhuǎn)聲,而動態(tài)噪音如開關(guān)門聲和人的語音出現(xiàn)頻率重疊時,傳統(tǒng)方法無法很好地抑制。隨著深度學(xué)習(xí)方法的飛速發(fā)展,更強(qiáng)大的深度神經(jīng)網(wǎng)絡(luò)被應(yīng)用于語音識別,包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)等。
思必馳智能降噪技術(shù)采用“傳統(tǒng)分離結(jié)合深度學(xué)習(xí)方案”,可以兼顧傳統(tǒng)信號處理的保真性和深度學(xué)習(xí)的非穩(wěn)態(tài)噪聲抑制能力,即在良好去除非穩(wěn)態(tài)噪聲的同時保證語音的較小失真,獲取純凈錄音,轉(zhuǎn)寫文本更準(zhǔn)確。
說話人識別,AI智能轉(zhuǎn)寫
在論壇、大中小型會議、課堂等場景,參會者們滔滔不絕各抒己見,準(zhǔn)確區(qū)分說話人并分角色輸出文本,變成了語音轉(zhuǎn)寫文字的一個重要標(biāo)準(zhǔn)。
人的聲紋具有特定的唯一性和穩(wěn)定性,聲紋識別可以通過聲紋辨別說話人。在上述會議、課堂等多人混合說話場景下,聲紋識別的目標(biāo)是讓機(jī)器將嘈雜環(huán)境下的多個混合說話人的聲音分離,識別每個說話人所說的內(nèi)容并判斷每個說話人的身份。
思必馳針對會議、學(xué)習(xí)場景,智慧辦公解決方案對音頻的前端處理通過聲源分離技術(shù),通過DOA、聲紋識別技術(shù)辨別說話人,拾音設(shè)備可以輕松區(qū)分說話人角色,按“角色”轉(zhuǎn)寫。結(jié)合算法降噪,盲源分離,提供相對更“干凈”的音頻文件;自動標(biāo)點識別、數(shù)字化處理等自然語言處理能力,能夠讓識別結(jié)果更加準(zhǔn)確、規(guī)范。
結(jié)合長語音識別、聲紋識別、AI降噪等,思必馳未來將持續(xù)助力企業(yè)實現(xiàn)降本增效,成就高效能人士。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 【評選啟動】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選
-
精彩回顧立即查看>> 【深圳 IEAE】2025 消費新場景創(chuàng)新與實踐論壇
-
精彩回顧立即查看>> 燧石技術(shù),賦光智慧,超越感知
-
精彩回顧立即查看>> 【線下會議】OFweek 2024(第九屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 2024(第五屆)全球數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)大會暨展覽會
- 1 110億低空經(jīng)濟(jì)獨角獸落子青島
- 2 申通快遞聯(lián)手菜鳥扔出王炸!無人車殺進(jìn)快遞圈
- 3 無人駕駛出租車,去哪都不方便
- 4 AI時代需要什么樣的園區(qū)網(wǎng)絡(luò)?答案藏在四個新技術(shù)里
- 5 韻達(dá)無人車跑到村口了!快遞業(yè)最后一公里被自動駕駛卷成黑科技現(xiàn)場
- 6 廈門殺出超級隱形冠軍:干出機(jī)場刷臉神器 全國第一
- 7 東北AI新地標(biāo),為什么是沈陽?為什么是百度?
- 8 AI智能鎖用戶洞察第四彈:用戶究竟偏好哪些AI功能?
- 9 首個!小鵬匯天飛行汽車工廠封頂
- 10 給掃地機(jī)裝上 “無人駕駛大腦”,清潔機(jī)器人也能當(dāng) “國際網(wǎng)紅”?