在线精品国产尤物,日本H无遮挡全彩翼漫画

狂奔三年，AI智能體祛魅

2025-08-07 11:12

商業(yè)秀

關(guān)注

從概念狂歡到務(wù)實進化。

文｜楊肖若編｜張弘一

出品｜商業(yè)秀

如果說，去年關(guān)于智能體的故事，還帶著“顛覆想象” 的性感濾鏡。今年這個故事的注腳，就變成了 “解決實際問題” 的務(wù)實底色。

從2023年至今，智能體的發(fā)展正從概念走向?qū)嵺`。在今年的世界人工智能大會上，我們看到各大廠商繼續(xù)推出自己新一代的智能體產(chǎn)品。它們在更垂直細分的領(lǐng)域比如金融、教育、文娛等領(lǐng)域落地。

有不少人把2025年稱為“智能體元年”。實際上，智能體的概念最早可以追溯到2023年以前。

螞蟻數(shù)科CTO王維在接受「商業(yè)秀」等媒體的采訪時指出，2024年11月就被大家稱作“智能體元年”，來到今年7月，元年的高峰已近尾聲。

王維的言外之意是，技術(shù)的迭代速度，如此之快，尤其是基于大模型的智能體。以ChatGPT為例，其獲得10億用戶、達成365億次查詢量的速度，比Google快了14倍。

在更具體的行業(yè)賽道，譬如智能體在金融行業(yè)的變革，也在加速。不過，智能體要迎來真正的爆發(fā)，仍面臨很多挑戰(zhàn)。至少，它還需要跨越“技術(shù)可靠、數(shù)據(jù)可控和生態(tài)協(xié)同” 的三重門檻。

01智能體狂奔三年：從概念到產(chǎn)業(yè)滲透

從2023年到2025年，智能體的進化軌跡，幾乎是劃出了一個陡峭曲線。在2023年之前，智能體的發(fā)展還停留在概念萌芽階段。這個時期，智能體經(jīng)歷了從 “工具化” 到初步智能。

中國信息通信研究院副總工程師王愛華認為，2023年之前的智能體還停留在 "代理型工具" 階段，就那些連客服機器人，也只能機械地給出一些標(biāo)準化回應(yīng)，彼時的智能體連最簡單的跨場景對話都難以完成，更談不上自主決策。

2024年，成為智能體發(fā)展的關(guān)鍵轉(zhuǎn)折點。大模型技術(shù)的滲透，讓智能體突然具備了"推理-記憶-行動" 的基礎(chǔ)能力。比如2024年推出的一些初代金融智能體，已經(jīng)能在金融場景中完成"客戶咨詢-需求匹配-業(yè)務(wù)辦理" 的半自動化流程。

不過，核心風(fēng)控環(huán)節(jié)上仍然需要人工來 "把關(guān)"，其可靠性和場景適配性還需要進一步提升。

進入2025年，智能體則呈現(xiàn)出了完全不同的氣質(zhì)，它們開始進入產(chǎn)業(yè)滲透階段，垂直深耕和實現(xiàn)規(guī)模化落地。這個階段的智能體主要呈現(xiàn)了三大核心特征。一是從“通用化” 轉(zhuǎn)向 “行業(yè)專用化”。比如金融、能源、工業(yè)等領(lǐng)域出現(xiàn)了很多深度定制的智能體。比如螞蟻數(shù)科推出了Agentar全棧企業(yè)級智能體平臺。該平臺通過知識工程、評測、安全風(fēng)控、MCP、金融大模型等能力，聯(lián)合行業(yè)開發(fā)了100余種金融智能體應(yīng)用方案，在智能風(fēng)控、營銷、財富管理等核心場景落地。

業(yè)內(nèi)認為，行業(yè)場景對智能體的“專業(yè)性”“可靠性” 要求遠高于通用能力，比如金融領(lǐng)域需嚴格規(guī)避 “模型幻覺”，工業(yè)領(lǐng)域需適配高溫、高壓等極端環(huán)境。

二是多智能體協(xié)同成為主流模式。通過多智能體協(xié)同，解決單智能體的“能力邊界” 問題，適配復(fù)雜產(chǎn)業(yè)場景的多元需求，比如金融領(lǐng)域的 “營銷智能體+風(fēng)控智能體+合規(guī)智能體” 協(xié)同，這樣一來，就可以覆蓋到業(yè)務(wù)全鏈條。三是從“輔助工具”升級為“生產(chǎn)力引擎”。據(jù)悉，一些銀已部署超1000個智能體，其中信用風(fēng)險識別智能體，能將中小客戶授信效率提升10倍，數(shù)據(jù)動態(tài)智能體實現(xiàn) “一句話調(diào)用全行數(shù)據(jù)”，推動業(yè)務(wù)模式從 “人找服務(wù)” 轉(zhuǎn)向 “服務(wù)找人”。也就是說，這個階段的智能體不再局限于“降本增效”，而是通過數(shù)據(jù)洞察和流程重構(gòu)，正在創(chuàng)造更多新的價值。02 金融與能源：智能體落地的必爭之地

在今年WAIC的產(chǎn)業(yè)圖譜中，金融和能源領(lǐng)域的智能體應(yīng)用最為突出。

背后的核心邏輯是什么？

王維認為，因為這兩個行業(yè)數(shù)字化程度最高、數(shù)據(jù)密度最大，且對效率提升的需求最迫切。

以金融為例，日均千萬級的交易數(shù)據(jù)和多層級風(fēng)控規(guī)則，傳統(tǒng)人工處理的誤差率超3%，而智能體可將這一數(shù)字壓縮到0.5%以內(nèi)。

但落地過程并非坦途。比如80%的金融機構(gòu)僅在客服等非核心場景測試智能體，清算、風(fēng)控等核心環(huán)節(jié)依然依賴人工。

這種謹慎源于雙重焦慮——它們既擔(dān)心錯失AI紅利，又害怕技術(shù)不成熟引發(fā)安全風(fēng)險。

也就是說，很多機構(gòu)之所以焦慮，并非源于排斥AI，而是發(fā)愁如何將這項新技術(shù)安全、有效地應(yīng)用到自己的業(yè)務(wù)場景中，真正解決問題。與此同時，他們看到同行用AI對業(yè)務(wù)有效果，內(nèi)心也期待能通過智能體來實現(xiàn)“彎道超車”。

但無論金融機構(gòu)和銀行等金融客戶做哪種選擇，都繞不開金融場景的復(fù)雜性。

對此，螞蟻數(shù)科是如何應(yīng)對的呢？它的策略是3個“E”。

一是Expertise（專業(yè)）。不沿用通用大模型路徑，基于長期金融經(jīng)驗制定覆蓋銀行、證券等全場景的6大類66小類金融任務(wù)體系，以此為框架從千億級數(shù)據(jù)中構(gòu)建專業(yè)訓(xùn)練數(shù)據(jù)集，加入原則類合成數(shù)據(jù)保障合規(guī)，使模型 “出廠即專家”。

二是Efficiency（效率）。訓(xùn)練中動態(tài)分配資源，提升復(fù)雜金融任務(wù)性能與學(xué)習(xí)效率，實現(xiàn) “淺調(diào)高能”，保障通用能力不退化，減少后續(xù)業(yè)務(wù)應(yīng)用的二次微調(diào)數(shù)據(jù)與算力消耗，降低企業(yè)落地門檻。

三是Evolution（進化）。建立高頻敏捷迭代機制，持續(xù)吸收金融政策、市場動態(tài)等信息，快速修復(fù)模型問題，確保知識、能力與合規(guī)性緊跟行業(yè)變化，在真實業(yè)務(wù)中不斷進化。

能源領(lǐng)域的突破，也同樣依賴場景適配。據(jù)中控技術(shù)工業(yè)AI技術(shù)管理總經(jīng)理王寬心介紹，其工業(yè)智能體通過"時序大模型+邊緣控制" 組合，已實現(xiàn)煉化裝置的無人值守：九個智能體分工協(xié)作，能支撐裝置自主運行一周以上，這在高溫高壓的工業(yè)環(huán)境中是一大突破。

據(jù)悉，目前螞蟻數(shù)科已聯(lián)合金融行業(yè)伙伴推出超百個金融智能體解決方案，覆蓋銀行、證券、保險、通用金融等四大領(lǐng)域，金融機構(gòu)可以“即插即用”，提升一線員工工作效率超80%。

03 三重門檻：技術(shù)、數(shù)據(jù)與生態(tài)的硬仗

盡管發(fā)展勢頭迅猛，但如今智能體的規(guī)�；涞�，仍需跨越三道硬門檻。

算力仍是懸在行業(yè)頭上的一把“利劍”。清華大學(xué)計算機科學(xué)與技術(shù)系教授鄭緯民直指“痛點”——大模型推理依賴GPU集群，目前大模型的推理算力成本還是很高。

他解釋到，“不管是推理也好，訓(xùn)練也好，算力成本還是很貴。推理成本里頭，人力占3%，數(shù)據(jù)占2%，算力占95%，錢主要是花在算力上面了。ChatGPT的推理開銷是每天70萬美元。DeepSeek V3推理開銷大概每天8.7萬美元。

業(yè)內(nèi)認為，大模型本身成本較高，雖然相關(guān)硬件和技術(shù)在發(fā)展，但相比過去的軟件售賣，成本仍然是金融機構(gòu)需要考量的重要因素。

一張卡的推理效率可能很慢，但調(diào)用多次對底層算力要求極高，如何平衡技術(shù)投入成本與商業(yè)價值，成為金融機構(gòu)和技術(shù)提供方需要解決的問題。

模型的"幻覺" 問題更讓金融機構(gòu)頭疼。尤其是在一些信貸審批等場景，智能體偶爾會給出錯誤信息，而客戶一般要求"每個決策，你都要說清理由"，這種可解釋性需求，單靠Prompt技術(shù)難以滿足。

螞蟻數(shù)科AI算法技術(shù)部總經(jīng)理章鵬解釋道，客戶需要知道大模型回答的思考過程，要求可解釋性，這就需要推理模型來解決，而在此之前，只能通過Prompt強制模型思考，但效果并不理想。

這也是螞蟻數(shù)科聯(lián)合中國工商銀行、寧波銀行、北京前沿金融監(jiān)管科技研究院、上海人工智能行業(yè)協(xié)會等機構(gòu)，聯(lián)合推出Finova大模型金融應(yīng)用評測基準的原因。

也就是，用更嚴苛的測試倒逼模型的可靠性提升。“客戶的需求在倒逼技術(shù)進化，從最初的‘你們?yōu)槭裁礇]有推理模型’，到現(xiàn)在的‘我憑什么相信你的回答’，市場的要求越來越具體，也越來越嚴苛。”章鵬說。

數(shù)據(jù)層面的挑戰(zhàn)同樣棘手。格創(chuàng)東智副總裁李楠吐槽道，"制造業(yè)的數(shù)據(jù)標(biāo)準，亂得像一鍋粥，同個產(chǎn)品的合格率計算，A工廠和B 工廠能差出三個版本。" 這種混亂導(dǎo)致70%的精力都耗在數(shù)據(jù)治理上，嚴重拖慢了智能體的落地節(jié)奏。

最后是產(chǎn)業(yè)落地層面，也面臨著信任建立與生態(tài)協(xié)同難題。一是行業(yè)觀望情緒濃厚，金融機構(gòu)僅在非核心場景（如客服）測試智能體，核心業(yè)務(wù)（如清算、風(fēng)控）仍依賴人工。一些機構(gòu)擔(dān)憂， “技術(shù)成熟度不足”“責(zé)任界定模糊”，如智能體決策失誤導(dǎo)致?lián)p失時，責(zé)任歸屬難以明確。

生態(tài)協(xié)同的碎片化，則是另一重阻礙。因為智能體產(chǎn)業(yè)鏈涉及硬件、模型、應(yīng)用等多環(huán)節(jié)，單一企業(yè)難以覆蓋全鏈條能力。例如，銀行部署智能體需協(xié)調(diào)模型提供商、系統(tǒng)集成商、監(jiān)管機構(gòu)等多方，協(xié)同成本高企。

為了降低成本，螞蟻數(shù)科推出了全尺寸模型家族，也給客戶提供了不同規(guī)格的模型，比如32B和8B版本的金融推理大模型Agentar-Fin-R1，以及基于百靈大模型的MOE架構(gòu)模型，讓客戶可以根據(jù)自身算力和場景需求選擇，平衡成本與效果。

結(jié)語

目前智能體仍處于快速發(fā)展階段，但要實現(xiàn)真正的爆發(fā)，還需要在技術(shù)完善、成本控制、滿足差異化需求等方面突破。

中信智庫發(fā)布的研究報告指出，2025年AI大模型向更強、更高效、更可靠方向發(fā)展，呈現(xiàn)推理模型深化、智能體模型爆發(fā)的格局。

今年也是AI應(yīng)用加速落地之年，但今年以來的智能體故事，少了些“性感”，多了些“硬仗”。這或許正是技術(shù)改變世界的必經(jīng)之路。

正如上海新金融研究院理事長、上海市原常務(wù)副市長屠光紹在2025年世界人工智能大會的論壇上所言——“智能體的真正價值，不在于概念多吸引人，而在于能否成為推動產(chǎn)業(yè)變革的‘可行生產(chǎn)力’。”

當(dāng)行業(yè)不再熱衷于討論“智能體能做什么”，而是聚焦“智能體該如何解決場景問題”時，智能體的產(chǎn)業(yè)價值，才真正開始釋放�！竿辍�

原文標(biāo)題 : 狂奔三年，AI智能體祛魅