狂奔三年,AI智能體祛魅
從概念狂歡到務(wù)實進化。
/
文|楊肖若 編|張弘一
出品|商業(yè)秀
如果說,去年關(guān)于智能體的故事,還帶著“顛覆想象” 的性感濾鏡。今年這個故事的注腳,就變成了 “解決實際問題” 的務(wù)實底色。
從2023年至今,智能體的發(fā)展正從概念走向?qū)嵺`。在今年的世界人工智能大會上,我們看到各大廠商繼續(xù)推出自己新一代的智能體產(chǎn)品。它們在更垂直細分的領(lǐng)域比如金融、教育、文娛等領(lǐng)域落地。
有不少人把2025年稱為“智能體元年”。實際上,智能體的概念最早可以追溯到2023年以前。
螞蟻數(shù)科CTO王維在接受「商業(yè)秀」等媒體的采訪時指出,2024年11月就被大家稱作“智能體元年”,來到今年7月,元年的高峰已近尾聲。
王維的言外之意是,技術(shù)的迭代速度,如此之快,尤其是基于大模型的智能體。以ChatGPT為例,其獲得10億用戶、達成365億次查詢量的速度,比Google快了14倍。
在更具體的行業(yè)賽道,譬如智能體在金融行業(yè)的變革,也在加速。不過,智能體要迎來真正的爆發(fā),仍面臨很多挑戰(zhàn)。至少,它還需要跨越“技術(shù)可靠、數(shù)據(jù)可控和生態(tài)協(xié)同” 的三重門檻。
01智能體狂奔三年:從概念到產(chǎn)業(yè)滲透
從2023年到2025年,智能體的進化軌跡,幾乎是劃出了一個陡峭曲線。在2023年之前,智能體的發(fā)展還停留在概念萌芽階段。這個時期,智能體經(jīng)歷了從 “工具化” 到初步智能。
中國信息通信研究院副總工程師王愛華認為,2023年之前的智能體還停留在 "代理型工具" 階段,就那些連客服機器人,也只能機械地給出一些標(biāo)準化回應(yīng),彼時的智能體連最簡單的跨場景對話都難以完成,更談不上自主決策。
2024年,成為智能體發(fā)展的關(guān)鍵轉(zhuǎn)折點。大模型技術(shù)的滲透,讓智能體突然具備了"推理-記憶-行動" 的基礎(chǔ)能力。比如2024年推出的一些初代金融智能體,已經(jīng)能在金融場景中完成"客戶咨詢-需求匹配-業(yè)務(wù)辦理" 的半自動化流程。
不過,核心風(fēng)控環(huán)節(jié)上仍然需要人工來 "把關(guān)",其可靠性和場景適配性還需要進一步提升。
進入2025年,智能體則呈現(xiàn)出了完全不同的氣質(zhì),它們開始進入產(chǎn)業(yè)滲透階段,垂直深耕和實現(xiàn)規(guī)模化落地。這個階段的智能體主要呈現(xiàn)了三大核心特征。一是從“通用化” 轉(zhuǎn)向 “行業(yè)專用化”。比如金融、能源、工業(yè)等領(lǐng)域出現(xiàn)了很多深度定制的智能體。比如螞蟻數(shù)科推出了Agentar全棧企業(yè)級智能體平臺。該平臺通過知識工程、評測、安全風(fēng)控、MCP、金融大模型等能力,聯(lián)合行業(yè)開發(fā)了100余種金融智能體應(yīng)用方案,在智能風(fēng)控、營銷、財富管理等核心場景落地。
業(yè)內(nèi)認為,行業(yè)場景對智能體的“專業(yè)性”“可靠性” 要求遠高于通用能力,比如金融領(lǐng)域需嚴格規(guī)避 “模型幻覺”,工業(yè)領(lǐng)域需適配高溫、高壓等極端環(huán)境。
二是多智能體協(xié)同成為主流模式。通過多智能體協(xié)同,解決單智能體的“能力邊界” 問題,適配復(fù)雜產(chǎn)業(yè)場景的多元需求,比如金融領(lǐng)域的 “營銷智能體+風(fēng)控智能體+合規(guī)智能體” 協(xié)同,這樣一來,就可以覆蓋到業(yè)務(wù)全鏈條。三是從“輔助工具”升級為“生產(chǎn)力引擎”。據(jù)悉,一些銀已部署超1000個智能體,其中信用風(fēng)險識別智能體,能將中小客戶授信效率提升10倍,數(shù)據(jù)動態(tài)智能體實現(xiàn) “一句話調(diào)用全行數(shù)據(jù)”,推動業(yè)務(wù)模式從 “人找服務(wù)” 轉(zhuǎn)向 “服務(wù)找人”。也就是說,這個階段的智能體不再局限于“降本增效”,而是通過數(shù)據(jù)洞察和流程重構(gòu),正在創(chuàng)造更多新的價值。02 金融與能源:智能體落地的必爭之地
在今年WAIC的產(chǎn)業(yè)圖譜中,金融和能源領(lǐng)域的智能體應(yīng)用最為突出。
背后的核心邏輯是什么?
王維認為,因為這兩個行業(yè)數(shù)字化程度最高、數(shù)據(jù)密度最大,且對效率提升的需求最迫切。
以金融為例,日均千萬級的交易數(shù)據(jù)和多層級風(fēng)控規(guī)則,傳統(tǒng)人工處理的誤差率超3%,而智能體可將這一數(shù)字壓縮到0.5%以內(nèi)。
但落地過程并非坦途。比如80%的金融機構(gòu)僅在客服等非核心場景測試智能體,清算、風(fēng)控等核心環(huán)節(jié)依然依賴人工。
這種謹慎源于雙重焦慮——它們既擔(dān)心錯失AI紅利,又害怕技術(shù)不成熟引發(fā)安全風(fēng)險。
也就是說,很多機構(gòu)之所以焦慮,并非源于排斥AI,而是發(fā)愁如何將這項新技術(shù)安全、有效地應(yīng)用到自己的業(yè)務(wù)場景中,真正解決問題。與此同時,他們看到同行用AI對業(yè)務(wù)有效果,內(nèi)心也期待能通過智能體來實現(xiàn)“彎道超車”。
但無論金融機構(gòu)和銀行等金融客戶做哪種選擇,都繞不開金融場景的復(fù)雜性。
對此,螞蟻數(shù)科是如何應(yīng)對的呢?它的策略是3個“E”。
一是Expertise(專業(yè))。不沿用通用大模型路徑,基于長期金融經(jīng)驗制定覆蓋銀行、證券等全場景的6大類66小類金融任務(wù)體系,以此為框架從千億級數(shù)據(jù)中構(gòu)建專業(yè)訓(xùn)練數(shù)據(jù)集,加入原則類合成數(shù)據(jù)保障合規(guī),使模型 “出廠即專家”。
二是Efficiency(效率)。訓(xùn)練中動態(tài)分配資源,提升復(fù)雜金融任務(wù)性能與學(xué)習(xí)效率,實現(xiàn) “淺調(diào)高能”,保障通用能力不退化,減少后續(xù)業(yè)務(wù)應(yīng)用的二次微調(diào)數(shù)據(jù)與算力消耗,降低企業(yè)落地門檻。
三是Evolution(進化)。建立高頻敏捷迭代機制,持續(xù)吸收金融政策、市場動態(tài)等信息,快速修復(fù)模型問題,確保知識、能力與合規(guī)性緊跟行業(yè)變化,在真實業(yè)務(wù)中不斷進化。
能源領(lǐng)域的突破,也同樣依賴場景適配。據(jù)中控技術(shù)工業(yè)AI技術(shù)管理總經(jīng)理王寬心介紹,其工業(yè)智能體通過"時序大模型+邊緣控制" 組合,已實現(xiàn)煉化裝置的無人值守:九個智能體分工協(xié)作,能支撐裝置自主運行一周以上,這在高溫高壓的工業(yè)環(huán)境中是一大突破。
據(jù)悉,目前螞蟻數(shù)科已聯(lián)合金融行業(yè)伙伴推出超百個金融智能體解決方案,覆蓋銀行、證券、保險、通用金融等四大領(lǐng)域,金融機構(gòu)可以“即插即用”,提升一線員工工作效率超80%。
03 三重門檻:技術(shù)、數(shù)據(jù)與生態(tài)的硬仗
盡管發(fā)展勢頭迅猛,但如今智能體的規(guī);涞,仍需跨越三道硬門檻。
算力仍是懸在行業(yè)頭上的一把“利劍”。清華大學(xué)計算機科學(xué)與技術(shù)系教授鄭緯民直指“痛點”——大模型推理依賴GPU集群,目前大模型的推理算力成本還是很高。
他解釋到,“不管是推理也好,訓(xùn)練也好,算力成本還是很貴。推理成本里頭,人力占3%,數(shù)據(jù)占2%,算力占95%,錢主要是花在算力上面了。ChatGPT的推理開銷是每天70萬美元。DeepSeek V3推理開銷大概每天8.7萬美元。
業(yè)內(nèi)認為,大模型本身成本較高,雖然相關(guān)硬件和技術(shù)在發(fā)展,但相比過去的軟件售賣,成本仍然是金融機構(gòu)需要考量的重要因素。
一張卡的推理效率可能很慢,但調(diào)用多次對底層算力要求極高,如何平衡技術(shù)投入成本與商業(yè)價值,成為金融機構(gòu)和技術(shù)提供方需要解決的問題。
模型的"幻覺" 問題更讓金融機構(gòu)頭疼。尤其是在一些信貸審批等場景,智能體偶爾會給出錯誤信息,而客戶一般要求"每個決策,你都要說清理由",這種可解釋性需求,單靠Prompt技術(shù)難以滿足。
螞蟻數(shù)科AI算法技術(shù)部總經(jīng)理章鵬解釋道,客戶需要知道大模型回答的思考過程,要求可解釋性,這就需要推理模型來解決,而在此之前,只能通過Prompt強制模型思考,但效果并不理想。
這也是螞蟻數(shù)科聯(lián)合中國工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會等機構(gòu),聯(lián)合推出Finova大模型金融應(yīng)用評測基準的原因。
也就是,用更嚴苛的測試倒逼模型的可靠性提升。“客戶的需求在倒逼技術(shù)進化,從最初的‘你們?yōu)槭裁礇]有推理模型’,到現(xiàn)在的‘我憑什么相信你的回答’,市場的要求越來越具體,也越來越嚴苛。”章鵬說。
數(shù)據(jù)層面的挑戰(zhàn)同樣棘手。格創(chuàng)東智副總裁李楠吐槽道,"制造業(yè)的數(shù)據(jù)標(biāo)準,亂得像一鍋粥,同個產(chǎn)品的合格率計算,A工廠和B 工廠能差出三個版本。" 這種混亂導(dǎo)致70%的精力都耗在數(shù)據(jù)治理上,嚴重拖慢了智能體的落地節(jié)奏。
最后是產(chǎn)業(yè)落地層面,也面臨著信任建立與生態(tài)協(xié)同難題。一是行業(yè)觀望情緒濃厚,金融機構(gòu)僅在非核心場景(如客服)測試智能體,核心業(yè)務(wù)(如清算、風(fēng)控)仍依賴人工。一些機構(gòu)擔(dān)憂, “技術(shù)成熟度不足”“責(zé)任界定模糊”,如智能體決策失誤導(dǎo)致?lián)p失時,責(zé)任歸屬難以明確。
生態(tài)協(xié)同的碎片化,則是另一重阻礙。因為智能體產(chǎn)業(yè)鏈涉及硬件、模型、應(yīng)用等多環(huán)節(jié),單一企業(yè)難以覆蓋全鏈條能力。例如,銀行部署智能體需協(xié)調(diào)模型提供商、系統(tǒng)集成商、監(jiān)管機構(gòu)等多方,協(xié)同成本高企。
為了降低成本,螞蟻數(shù)科推出了全尺寸模型家族,也給客戶提供了不同規(guī)格的模型,比如32B和8B版本的金融推理大模型Agentar-Fin-R1,以及基于百靈大模型的MOE架構(gòu)模型,讓客戶可以根據(jù)自身算力和場景需求選擇,平衡成本與效果。
結(jié)語
目前智能體仍處于快速發(fā)展階段,但要實現(xiàn)真正的爆發(fā),還需要在技術(shù)完善、成本控制、滿足差異化需求等方面突破。
中信智庫發(fā)布的研究報告指出,2025年AI大模型向更強、更高效、更可靠方向發(fā)展,呈現(xiàn)推理模型深化、智能體模型爆發(fā)的格局。
今年也是AI應(yīng)用加速落地之年,但今年以來的智能體故事,少了些“性感”,多了些“硬仗”。這或許正是技術(shù)改變世界的必經(jīng)之路。
正如上海新金融研究院理事長、上海市原常務(wù)副市長屠光紹在2025年世界人工智能大會的論壇上所言——“智能體的真正價值,不在于概念多吸引人,而在于能否成為推動產(chǎn)業(yè)變革的‘可行生產(chǎn)力’。”
當(dāng)行業(yè)不再熱衷于討論“智能體能做什么”,而是聚焦“智能體該如何解決場景問題”時,智能體的產(chǎn)業(yè)價值,才真正開始釋放!竿辍
原文標(biāo)題 : 狂奔三年,AI智能體祛魅

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
8月14日立即報名>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
即日-9.1立即下載>> 【限時下載】ADI中國三十周年感恩回饋助力企業(yè)升級!
-
精彩回顧立即查看>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會2025(第六屆)機器人及智能工廠展
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機器人借殼上市,A股人形機器人第一股!
- 8 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進化