訂閱
糾錯
加入自媒體

狂奔三年,AI智能體祛魅

從概念狂歡到務(wù)實進化。

/

文|楊肖若  編|張弘一

出品|商業(yè)秀

如果說,去年關(guān)于智能體的故事,還帶著“顛覆想象” 的性感濾鏡。今年這個故事的注腳,就變成了 “解決實際問題” 的務(wù)實底色。

從2023年至今,智能體的發(fā)展正從概念走向?qū)嵺`。在今年的世界人工智能大會上,我們看到各大廠商繼續(xù)推出自己新一代的智能體產(chǎn)品。它們在更垂直細分的領(lǐng)域比如金融、教育、文娛等領(lǐng)域落地。

有不少人把2025年稱為“智能體元年”。實際上,智能體的概念最早可以追溯到2023年以前。

螞蟻數(shù)科CTO王維在接受「商業(yè)秀」等媒體的采訪時指出,2024年11月就被大家稱作“智能體元年”,來到今年7月,元年的高峰已近尾聲。

王維的言外之意是,技術(shù)的迭代速度,如此之快,尤其是基于大模型的智能體。以ChatGPT為例,其獲得10億用戶、達成365億次查詢量的速度,比Google快了14倍。

在更具體的行業(yè)賽道,譬如智能體在金融行業(yè)的變革,也在加速。不過,智能體要迎來真正的爆發(fā),仍面臨很多挑戰(zhàn)。至少,它還需要跨越“技術(shù)可靠、數(shù)據(jù)可控和生態(tài)協(xié)同” 的三重門檻。

01智能體狂奔三年:從概念到產(chǎn)業(yè)滲透

從2023年到2025年,智能體的進化軌跡,幾乎是劃出了一個陡峭曲線。在2023年之前,智能體的發(fā)展還停留在概念萌芽階段。這個時期,智能體經(jīng)歷了從 “工具化” 到初步智能。

中國信息通信研究院副總工程師王愛華認為,2023年之前的智能體還停留在 "代理型工具" 階段,就那些連客服機器人,也只能機械地給出一些標(biāo)準化回應(yīng),彼時的智能體連最簡單的跨場景對話都難以完成,更談不上自主決策。

2024年,成為智能體發(fā)展的關(guān)鍵轉(zhuǎn)折點。大模型技術(shù)的滲透,讓智能體突然具備了"推理-記憶-行動" 的基礎(chǔ)能力。比如2024年推出的一些初代金融智能體,已經(jīng)能在金融場景中完成"客戶咨詢-需求匹配-業(yè)務(wù)辦理" 的半自動化流程。

不過,核心風(fēng)控環(huán)節(jié)上仍然需要人工來 "把關(guān)",其可靠性和場景適配性還需要進一步提升。

進入2025年,智能體則呈現(xiàn)出了完全不同的氣質(zhì),它們開始進入產(chǎn)業(yè)滲透階段,垂直深耕和實現(xiàn)規(guī)模化落地。這個階段的智能體主要呈現(xiàn)了三大核心特征。一是從“通用化” 轉(zhuǎn)向 “行業(yè)專用化”。比如金融、能源、工業(yè)等領(lǐng)域出現(xiàn)了很多深度定制的智能體。比如螞蟻數(shù)科推出了Agentar全棧企業(yè)級智能體平臺。該平臺通過知識工程、評測、安全風(fēng)控、MCP、金融大模型等能力,聯(lián)合行業(yè)開發(fā)了100余種金融智能體應(yīng)用方案,在智能風(fēng)控、營銷、財富管理等核心場景落地。

業(yè)內(nèi)認為,行業(yè)場景對智能體的“專業(yè)性”“可靠性” 要求遠高于通用能力,比如金融領(lǐng)域需嚴格規(guī)避 “模型幻覺”,工業(yè)領(lǐng)域需適配高溫、高壓等極端環(huán)境。

二是多智能體協(xié)同成為主流模式。通過多智能體協(xié)同,解決單智能體的“能力邊界” 問題,適配復(fù)雜產(chǎn)業(yè)場景的多元需求,比如金融領(lǐng)域的 “營銷智能體+風(fēng)控智能體+合規(guī)智能體” 協(xié)同,這樣一來,就可以覆蓋到業(yè)務(wù)全鏈條。三是從“輔助工具”升級為“生產(chǎn)力引擎”。據(jù)悉,一些銀已部署超1000個智能體,其中信用風(fēng)險識別智能體,能將中小客戶授信效率提升10倍,數(shù)據(jù)動態(tài)智能體實現(xiàn) “一句話調(diào)用全行數(shù)據(jù)”,推動業(yè)務(wù)模式從 “人找服務(wù)” 轉(zhuǎn)向 “服務(wù)找人”。也就是說,這個階段的智能體不再局限于“降本增效”,而是通過數(shù)據(jù)洞察和流程重構(gòu),正在創(chuàng)造更多新的價值。02 金融與能源:智能體落地的必爭之地

在今年WAIC的產(chǎn)業(yè)圖譜中,金融和能源領(lǐng)域的智能體應(yīng)用最為突出。

背后的核心邏輯是什么?

王維認為,因為這兩個行業(yè)數(shù)字化程度最高、數(shù)據(jù)密度最大,且對效率提升的需求最迫切。

以金融為例,日均千萬級的交易數(shù)據(jù)和多層級風(fēng)控規(guī)則,傳統(tǒng)人工處理的誤差率超3%,而智能體可將這一數(shù)字壓縮到0.5%以內(nèi)。

但落地過程并非坦途。比如80%的金融機構(gòu)僅在客服等非核心場景測試智能體,清算、風(fēng)控等核心環(huán)節(jié)依然依賴人工。

這種謹慎源于雙重焦慮——它們既擔(dān)心錯失AI紅利,又害怕技術(shù)不成熟引發(fā)安全風(fēng)險。

也就是說,很多機構(gòu)之所以焦慮,并非源于排斥AI,而是發(fā)愁如何將這項新技術(shù)安全、有效地應(yīng)用到自己的業(yè)務(wù)場景中,真正解決問題。與此同時,他們看到同行用AI對業(yè)務(wù)有效果,內(nèi)心也期待能通過智能體來實現(xiàn)“彎道超車”。

但無論金融機構(gòu)和銀行等金融客戶做哪種選擇,都繞不開金融場景的復(fù)雜性。

對此,螞蟻數(shù)科是如何應(yīng)對的呢?它的策略是3個“E”。

一是Expertise(專業(yè))。不沿用通用大模型路徑,基于長期金融經(jīng)驗制定覆蓋銀行、證券等全場景的6大類66小類金融任務(wù)體系,以此為框架從千億級數(shù)據(jù)中構(gòu)建專業(yè)訓(xùn)練數(shù)據(jù)集,加入原則類合成數(shù)據(jù)保障合規(guī),使模型 “出廠即專家”。

二是Efficiency(效率)。訓(xùn)練中動態(tài)分配資源,提升復(fù)雜金融任務(wù)性能與學(xué)習(xí)效率,實現(xiàn) “淺調(diào)高能”,保障通用能力不退化,減少后續(xù)業(yè)務(wù)應(yīng)用的二次微調(diào)數(shù)據(jù)與算力消耗,降低企業(yè)落地門檻。

三是Evolution(進化)。建立高頻敏捷迭代機制,持續(xù)吸收金融政策、市場動態(tài)等信息,快速修復(fù)模型問題,確保知識、能力與合規(guī)性緊跟行業(yè)變化,在真實業(yè)務(wù)中不斷進化。

能源領(lǐng)域的突破,也同樣依賴場景適配。據(jù)中控技術(shù)工業(yè)AI技術(shù)管理總經(jīng)理王寬心介紹,其工業(yè)智能體通過"時序大模型+邊緣控制" 組合,已實現(xiàn)煉化裝置的無人值守:九個智能體分工協(xié)作,能支撐裝置自主運行一周以上,這在高溫高壓的工業(yè)環(huán)境中是一大突破。

據(jù)悉,目前螞蟻數(shù)科已聯(lián)合金融行業(yè)伙伴推出超百個金融智能體解決方案,覆蓋銀行、證券、保險、通用金融等四大領(lǐng)域,金融機構(gòu)可以“即插即用”,提升一線員工工作效率超80%。

03 三重門檻:技術(shù)、數(shù)據(jù)與生態(tài)的硬仗

盡管發(fā)展勢頭迅猛,但如今智能體的規(guī);涞,仍需跨越三道硬門檻。

算力仍是懸在行業(yè)頭上的一把“利劍”。清華大學(xué)計算機科學(xué)與技術(shù)系教授鄭緯民直指“痛點”——大模型推理依賴GPU集群,目前大模型的推理算力成本還是很高。

他解釋到,“不管是推理也好,訓(xùn)練也好,算力成本還是很貴。推理成本里頭,人力占3%,數(shù)據(jù)占2%,算力占95%,錢主要是花在算力上面了。ChatGPT的推理開銷是每天70萬美元。DeepSeek V3推理開銷大概每天8.7萬美元。

業(yè)內(nèi)認為,大模型本身成本較高,雖然相關(guān)硬件和技術(shù)在發(fā)展,但相比過去的軟件售賣,成本仍然是金融機構(gòu)需要考量的重要因素。

一張卡的推理效率可能很慢,但調(diào)用多次對底層算力要求極高,如何平衡技術(shù)投入成本與商業(yè)價值,成為金融機構(gòu)和技術(shù)提供方需要解決的問題。

模型的"幻覺" 問題更讓金融機構(gòu)頭疼。尤其是在一些信貸審批等場景,智能體偶爾會給出錯誤信息,而客戶一般要求"每個決策,你都要說清理由",這種可解釋性需求,單靠Prompt技術(shù)難以滿足。

螞蟻數(shù)科AI算法技術(shù)部總經(jīng)理章鵬解釋道,客戶需要知道大模型回答的思考過程,要求可解釋性,這就需要推理模型來解決,而在此之前,只能通過Prompt強制模型思考,但效果并不理想。

這也是螞蟻數(shù)科聯(lián)合中國工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會等機構(gòu),聯(lián)合推出Finova大模型金融應(yīng)用評測基準的原因。

也就是,用更嚴苛的測試倒逼模型的可靠性提升。“客戶的需求在倒逼技術(shù)進化,從最初的‘你們?yōu)槭裁礇]有推理模型’,到現(xiàn)在的‘我憑什么相信你的回答’,市場的要求越來越具體,也越來越嚴苛。”章鵬說。

數(shù)據(jù)層面的挑戰(zhàn)同樣棘手。格創(chuàng)東智副總裁李楠吐槽道,"制造業(yè)的數(shù)據(jù)標(biāo)準,亂得像一鍋粥,同個產(chǎn)品的合格率計算,A工廠和B 工廠能差出三個版本。" 這種混亂導(dǎo)致70%的精力都耗在數(shù)據(jù)治理上,嚴重拖慢了智能體的落地節(jié)奏。

最后是產(chǎn)業(yè)落地層面,也面臨著信任建立與生態(tài)協(xié)同難題。一是行業(yè)觀望情緒濃厚,金融機構(gòu)僅在非核心場景(如客服)測試智能體,核心業(yè)務(wù)(如清算、風(fēng)控)仍依賴人工。一些機構(gòu)擔(dān)憂, “技術(shù)成熟度不足”“責(zé)任界定模糊”,如智能體決策失誤導(dǎo)致?lián)p失時,責(zé)任歸屬難以明確。

生態(tài)協(xié)同的碎片化,則是另一重阻礙。因為智能體產(chǎn)業(yè)鏈涉及硬件、模型、應(yīng)用等多環(huán)節(jié),單一企業(yè)難以覆蓋全鏈條能力。例如,銀行部署智能體需協(xié)調(diào)模型提供商、系統(tǒng)集成商、監(jiān)管機構(gòu)等多方,協(xié)同成本高企。

為了降低成本,螞蟻數(shù)科推出了全尺寸模型家族,也給客戶提供了不同規(guī)格的模型,比如32B和8B版本的金融推理大模型Agentar-Fin-R1,以及基于百靈大模型的MOE架構(gòu)模型,讓客戶可以根據(jù)自身算力和場景需求選擇,平衡成本與效果。

結(jié)語

目前智能體仍處于快速發(fā)展階段,但要實現(xiàn)真正的爆發(fā),還需要在技術(shù)完善、成本控制、滿足差異化需求等方面突破。

中信智庫發(fā)布的研究報告指出,2025年AI大模型向更強、更高效、更可靠方向發(fā)展,呈現(xiàn)推理模型深化、智能體模型爆發(fā)的格局。

今年也是AI應(yīng)用加速落地之年,但今年以來的智能體故事,少了些“性感”,多了些“硬仗”。這或許正是技術(shù)改變世界的必經(jīng)之路。

正如上海新金融研究院理事長、上海市原常務(wù)副市長屠光紹在2025年世界人工智能大會的論壇上所言——“智能體的真正價值,不在于概念多吸引人,而在于能否成為推動產(chǎn)業(yè)變革的‘可行生產(chǎn)力’。”

當(dāng)行業(yè)不再熱衷于討論“智能體能做什么”,而是聚焦“智能體該如何解決場景問題”時,智能體的產(chǎn)業(yè)價值,才真正開始釋放!竿辍

       原文標(biāo)題 : 狂奔三年,AI智能體祛魅

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號