訂閱
糾錯(cuò)
加入自媒體

趨勢(shì)丨離線(xiàn)+記憶,離線(xiàn)大模型將成下一代通用人工智能的基石

前言

在數(shù)字化時(shí)代,大模型技術(shù)正以前所未有的速度改變,成為推動(dòng)各行業(yè)變革的核心力量。 

2025年,大模型領(lǐng)域迎來(lái)了新一輪的爆發(fā)式增長(zhǎng)與結(jié)構(gòu)性?xún)?yōu)化,從技術(shù)突破到商業(yè)應(yīng)用,從市場(chǎng)競(jìng)爭(zhēng)到產(chǎn)業(yè)生態(tài)構(gòu)建,都呈現(xiàn)出令人矚目的新態(tài)勢(shì),尤其是在今年的世界人工智能大會(huì)(WAIC)上,離線(xiàn)大模型成為了備受關(guān)注的焦點(diǎn)之一。 

作者 | 方文三

圖片來(lái)源 |  網(wǎng) 絡(luò) 

 

圖片

 

多模態(tài)融合,拓展感知邊界 

2025年上半年,大模型在多模態(tài)技術(shù)上取得了重大突破,實(shí)現(xiàn)了從單一文本交互到“圖文音視頻”全模態(tài)融合的跨越。

這一進(jìn)展使得大模型能夠更全面、準(zhǔn)確地理解和處理信息,為用戶(hù)提供更加豐富、直觀的交互體驗(yàn)。

Gartner預(yù)計(jì),到2027年,40%的生成式AI解決方案將采用多模態(tài)技術(shù),較2023年的1%顯著提升。

在國(guó)內(nèi),火山引擎于今年6月發(fā)布豆包大模型1.6、視頻生成模型Seedance1.0pro等新模型,其中豆包1.6系列模型支持多模態(tài)理解和圖形界面操作,讓用戶(hù)能夠通過(guò)圖像、語(yǔ)音等多種方式與模型進(jìn)行交互,極大地拓展了應(yīng)用場(chǎng)景。

商湯日日新大模型從1月推出原生融合模態(tài)版本,到4月升級(jí)V6實(shí)現(xiàn)多模態(tài)推理突破,不斷迭代技術(shù),提升模型的多模態(tài)處理能力。

快手可靈AI構(gòu)建多模態(tài)創(chuàng)意生產(chǎn)力平臺(tái),上線(xiàn)一年多以來(lái),已累計(jì)生成1.68億個(gè)視頻和3.44億張圖片,為內(nèi)容創(chuàng)作領(lǐng)域帶來(lái)了新的活力。

 

圖片

離線(xiàn)大模型,獨(dú)立運(yùn)行與記憶革新 

在大模型技術(shù)蓬勃發(fā)展的當(dāng)下,離線(xiàn)大模型憑借獨(dú)特優(yōu)勢(shì)成為行業(yè)新焦點(diǎn)。

其最大特點(diǎn)是能在無(wú)網(wǎng)絡(luò)連接的情況下獨(dú)立運(yùn)行,這有效規(guī)避了網(wǎng)絡(luò)不穩(wěn)定或斷網(wǎng)導(dǎo)致的服務(wù)中斷問(wèn)題。

在野外探險(xiǎn)、偏遠(yuǎn)地區(qū)作業(yè)以及網(wǎng)絡(luò)信號(hào)差的場(chǎng)所,離線(xiàn)大模型設(shè)備能穩(wěn)定提供智能服務(wù)。

從技術(shù)層面來(lái)看,離線(xiàn)大模型實(shí)現(xiàn)了模型的本地化部署,數(shù)據(jù)處理和計(jì)算都在本地設(shè)備完成,極大提升了隱私安全性

像醫(yī)療、金融等對(duì)數(shù)據(jù)保密性要求極高的行業(yè),使用離線(xiàn)大模型可確保敏感數(shù)據(jù)不出本地,降低數(shù)據(jù)泄露風(fēng)險(xiǎn)。

 

圖片

 

今年WAIC上,諸多企業(yè)展示新成果 

RockAI推出的最新版非Transformer架構(gòu)大模型Yan 2.0 Preview,在離線(xiàn)和記憶功能方面表現(xiàn)亮眼。

它打破傳統(tǒng),將離線(xiàn)大模型部署邊界下探到“千元機(jī)”級(jí)別,讓低配置設(shè)備也能實(shí)現(xiàn)離線(xiàn)實(shí)時(shí)AI運(yùn)算。

新增的“記憶模塊”是一大突破,如同人類(lèi)大腦海馬體,能存儲(chǔ)學(xué)習(xí)過(guò)程中的關(guān)鍵信息并在新場(chǎng)景快速調(diào)用。 

現(xiàn)場(chǎng)演示中,搭載該模型的機(jī)器狗,無(wú)需預(yù)設(shè)程序,通過(guò)記憶模塊學(xué)習(xí)工作人員展示的自定義新動(dòng)作后成功執(zhí)行,這種持續(xù)進(jìn)化和自主決策能力,是傳統(tǒng)大模型難以企及的。

 

圖片

 

Google DeepMind推出的Gemini Robotics On-Device模型也備受矚目,作為專(zhuān)為雙臂機(jī)器人設(shè)計(jì)的VLA基礎(chǔ)模型,它能直接解析自然語(yǔ)言指令并驅(qū)動(dòng)機(jī)器人執(zhí)行相應(yīng)動(dòng)作。

核心優(yōu)勢(shì)在于能在機(jī)器人本地離線(xiàn)運(yùn)行,同時(shí)處理視覺(jué)識(shí)別、語(yǔ)言理解與動(dòng)作執(zhí)行任務(wù),在醫(yī)療操作、災(zāi)難救援、工廠(chǎng)自動(dòng)化等對(duì)實(shí)時(shí)性和穩(wěn)定性要求高的場(chǎng)景中,有效避免了云端傳輸?shù)难舆t和潛在風(fēng)險(xiǎn)。

另外,谷歌開(kāi)源的AI Edge Gallery,允許用戶(hù)在手機(jī)上本地運(yùn)行大模型,完全離線(xiàn)且免費(fèi),支持從Hugging Face下載各種大模型,實(shí)現(xiàn)不聯(lián)網(wǎng)狀態(tài)下的聊天、識(shí)圖、代碼生成和文本推理等功能,滿(mǎn)足了用戶(hù)在隱私保護(hù)、本地算力利用以及弱網(wǎng)環(huán)境下使用AI的需求 。

英特爾展示的基于本地的大語(yǔ)言模型采用三合一模型,可離線(xiàn)運(yùn)行。中文語(yǔ)料庫(kù)搭載62億參數(shù)的GIM2 - 6B模型,擁有32K的上下文支持能力,通過(guò)超1.4萬(wàn)億的英文和中文令牌進(jìn)行預(yù)訓(xùn)練,模型性能和推理能力較強(qiáng)。

還本地化部署了專(zhuān)門(mén)處理編程語(yǔ)言的starcolder - 15.5B模型,方便程序員在離線(xiàn)環(huán)境下進(jìn)行代碼生成和理解 。

這些企業(yè)的成果展示,不僅體現(xiàn)了離線(xiàn)大模型在技術(shù)上的創(chuàng)新突破,也預(yù)示著其在未來(lái)智能設(shè)備、工業(yè)生產(chǎn)、個(gè)人隱私保護(hù)等多領(lǐng)域的廣闊應(yīng)用前景。

 

圖片

結(jié)尾:智能的“最后一公里”,我們準(zhǔn)備好了嗎? 

當(dāng)一個(gè)擁有自主行動(dòng)能力的智能體,可以在我們的物理世界中離線(xiàn)活動(dòng)時(shí),它所帶來(lái)的想象空間是巨大的。從能夠照顧老人的家庭伴侶,到可以進(jìn)行精細(xì)操作的外科手術(shù)助手,再到能夠深入險(xiǎn)境的救援隊(duì)員,機(jī)器人的應(yīng)用邊界被前所未有地拓寬了。

然而,這也帶來(lái)了新的思考。當(dāng)機(jī)器的決策過(guò)程完全在本地完成,變得不再那么透明和可控時(shí),我們?nèi)绾未_保其行為的安全性與可靠性?當(dāng)一個(gè)機(jī)器人能夠在沒(méi)有外部監(jiān)督的情況下自主學(xué)習(xí)和行動(dòng),我們又該如何界定責(zé)任的邊界?

Google DeepMind實(shí)驗(yàn)室的這一步,無(wú)疑是邁向通用人工智能的重要一步,它叩響了物理世界智能化的大門(mén)。但這扇門(mén)背后,既有前所未見(jiàn)的機(jī)遇,也有需要我們審慎面對(duì)的挑戰(zhàn)。這不僅僅是工程師和科學(xué)家的議題,更是我們每一個(gè)人都需要開(kāi)始思考的未來(lái)。

內(nèi)容來(lái)源于:

36氪:離線(xiàn)+記憶,大模型進(jìn)化的分水嶺

尕燚龍科技茶館:Google機(jī)器人離線(xiàn)模型,從“云端智者”走向“地面實(shí)干家”

醫(yī)械筆記本:斷網(wǎng)沒(méi)關(guān)系,谷歌發(fā)布具身智能離線(xiàn)模型,可本地化部署

       原文標(biāo)題 : AI芯天下丨趨勢(shì)丨離線(xiàn)+記憶,離線(xiàn)大模型將成下一代通用人工智能的基石

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)