騰訊AI翻譯首次亮相博鰲論壇,只證明了這一件事
“一帶一路”=“一條腰帶和一條路”?
4月9日下午,“騰訊同傳”在博鰲論壇現(xiàn)場(chǎng)上鬧了一個(gè)大烏龍。
這是博鰲論壇首次采用AI同聲傳譯技術(shù),作為頭一份的“騰訊同傳”竟然還出現(xiàn)這種離譜的翻譯錯(cuò)誤。
另外,從網(wǎng)上一些上傳的現(xiàn)場(chǎng)翻譯圖片來看,一些錯(cuò)誤簡(jiǎn)直令人不忍直視:
按照官方所稱,上面的錯(cuò)誤簡(jiǎn)稱“大面積單詞無意義重復(fù)、大小寫及字符混亂”。
首次亮相結(jié)果鬧烏龍,說好的取代人類呢?
在博鰲論壇現(xiàn)場(chǎng),基于自研的NMT(神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯)、語音識(shí)別等技術(shù),“騰訊同傳”會(huì)實(shí)時(shí)識(shí)別、翻譯各國(guó)嘉賓的演講內(nèi)容,并同時(shí)以中英雙語的字幕形式進(jìn)行投屏展示。另外,觀眾還可利用微信小程序?qū)钨e演講的雙語同傳內(nèi)容進(jìn)行回看、收聽和記錄。
從提供的服務(wù)內(nèi)容來看,騰訊的同聲傳譯聽起來還是不錯(cuò)的。然而,從上面的錯(cuò)誤來看,體驗(yàn)有些糟糕呢。
對(duì)此,也有網(wǎng)友也進(jìn)行了調(diào)侃:
對(duì)于此次烏龍,騰訊官方也沒有試圖遮掩,并針對(duì)圖片中“大面積單詞無意義重復(fù)、大小寫及字符混亂”的錯(cuò)誤給出了解釋。
譬如中英雙語切換頻率的問題,官方解釋:
當(dāng)聲源在兩種語言之間不斷轉(zhuǎn)換時(shí),后臺(tái)中、英文識(shí)別引擎就會(huì)同時(shí)開始工作,這會(huì)導(dǎo)致兩種識(shí)別引擎互相“掐架”,而翻譯結(jié)果卻只能選擇一種語言進(jìn)行輸出,再加上對(duì)嘉賓每個(gè)語氣詞也做了精準(zhǔn)的啊啊啊翻譯,導(dǎo)致引發(fā)錯(cuò)誤。
又比如“for”的問題,官方稱:
出現(xiàn)這種情況主要是包括神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯在內(nèi)的深度學(xué)習(xí)算法,在原理上或多或少都有一定不確定性,在特定的情況下有一定的概率引發(fā)翻譯偏差。今天的嘉賓演講內(nèi)容中包含“for for for for”、 ”that’s that’s that”等重復(fù)內(nèi)容,而翻譯引擎不巧放大了這個(gè)重復(fù),導(dǎo)致了翻譯結(jié)果出現(xiàn)錯(cuò)誤。
AI同聲傳譯的玩家不在少數(shù),鬧烏龍的也不止騰訊一家
目前,包括騰訊在內(nèi),涉及AI同聲傳譯市場(chǎng)的玩家也不在少數(shù),比如科大訊飛、搜狗、百度等公司。
在市場(chǎng)的玩法上,他們的套路基本可以分為兩種,一類是以翻譯APP、API接口形式存在的軟件產(chǎn)品,譬如此次騰訊參加博鰲論壇的產(chǎn)品;另一類則是AI同聲傳譯硬件產(chǎn)品,最為典型的代表就是科大訊飛的“曉譯翻譯機(jī)”,以及搜狗的“搜狗旅行翻譯寶”。
從網(wǎng)上的一些用戶體驗(yàn)來看,再結(jié)合此次騰訊同聲傳譯的情況,我們只能說,會(huì)鬧烏龍的不只是騰訊一家。
以科大訊飛的曉譯翻譯機(jī)為例,有網(wǎng)友以幾句英語教學(xué)的錄音來進(jìn)行測(cè)試,如下:
According to our records, a room for two guests was booked under your name.
谷歌:根據(jù)我們的記錄,有兩位客人的房間是以您的名義預(yù)定的。
訊飛翻譯機(jī):根據(jù)我們的房間記錄,兩位客人,你們的名字都是什么?
Today we have grilled tuna and New York strip steak served with creamy Italian herb sauce.
谷歌:今天我們有烤金槍魚紐約牛排配奶油意大利香草醬。
訊飛翻譯機(jī):吉姆去紐約的牛排,配有干凈的意大利香草醬 / 蒂姆已經(jīng)得到了一份紐約的牛排,用來清潔意大利的泥土沙司。
又比如搜狗的旅行翻譯寶,在正常的翻譯過程中,其也是偶有錯(cuò)誤,而在對(duì)話內(nèi)容較為復(fù)雜,或者語速過快等場(chǎng)景下,它的語音識(shí)別也會(huì)出現(xiàn)問題,之后的AI翻譯自然是無法理解。又比如阿里巴巴的AI系統(tǒng),此前的一場(chǎng)云棲大會(huì)中,該系統(tǒng)直接將“nationally”翻譯成了“男生弄亂”,讓演講者馬云爸爸在現(xiàn)場(chǎng)呆愣了5秒。
最后:AI翻譯還處于初期發(fā)展階段,想要取代人類還很早
當(dāng)前,國(guó)外的谷歌、微軟,國(guó)內(nèi)的BAT、科大訊飛、搜狗等公司均在加緊布局AI翻譯市場(chǎng),發(fā)布各類軟硬件產(chǎn)品。在技術(shù)層面,NMT是多個(gè)公司在AI翻譯產(chǎn)品中所采用的技術(shù),其能夠模仿人腦神經(jīng)思考的模式進(jìn)行翻譯。不過,騰訊方面此次的回應(yīng)則表明,技術(shù)依舊存在不確定性的。
不僅僅是技術(shù),AI翻譯的訓(xùn)練數(shù)據(jù)也跟不上了。在一些AI速記的應(yīng)用場(chǎng)景中,我們能夠看見,為了保證現(xiàn)場(chǎng)實(shí)時(shí)速記的準(zhǔn)確率,工作人員一般都會(huì)提前用大量針對(duì)性數(shù)據(jù)來對(duì)系統(tǒng)進(jìn)行訓(xùn)練。
比如此次鬧出烏龍的騰訊,在備戰(zhàn)期間,“騰訊同傳”也學(xué)習(xí)了該論壇過往數(shù)百份演講稿。然而,從現(xiàn)實(shí)情況來看,訓(xùn)練的數(shù)據(jù)依舊是不夠的,畢竟連“一帶一路”這一固定詞匯都能翻譯錯(cuò)誤。
遙想此前,包括騰訊在內(nèi),在發(fā)布AI翻譯產(chǎn)品的時(shí)候都以“替代人類翻譯員”為自己的標(biāo)語。不過,從現(xiàn)實(shí)情況來看,技術(shù)依舊存在不確定性、數(shù)據(jù)欠缺。這只能證明一件事,AI翻譯想要取代人類翻譯員,還有一段路要走。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
8月14日立即報(bào)名>> 【在線研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
精彩回顧立即查看>> OFweek 2025 具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車出海美國(guó)
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 5 具身智能泡沫爭(zhēng)議下,華映資本尋找「穿越周期者」
- 6 中國(guó)平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實(shí)現(xiàn)突圍,國(guó)產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進(jìn)化