訂閱
糾錯(cuò)
加入自媒體

Agent 2025:AI的窄門與寬路

在“AI Agent元年”的光環(huán)之下,AI Agent賽道是否只是一場虛假繁榮?

內(nèi)容/林書

編輯/詠鵝

校對(duì)/莽夫

隨著在復(fù)雜推理、多模態(tài)融合以及自主代理(Agent)能力上更強(qiáng)大的GPT-5發(fā)布,有人高呼“AI Agent時(shí)代真的來了”,也有人持謹(jǐn)慎態(tài)度,認(rèn)為“GPT-5是對(duì)AI Agent創(chuàng)業(yè)者的洗牌”。

當(dāng)前的AI智能體創(chuàng)業(yè),正如朱嘯虎所言,“非常像互聯(lián)網(wǎng)早期的個(gè)人站長”,既充滿草根精神,又面臨殘酷淘汰。曾被捧為“國運(yùn)級(jí)產(chǎn)品”、內(nèi)測邀請(qǐng)碼一度炒至10萬元一個(gè)的AI Agent產(chǎn)品Manus退出中國市場,更是為這一賽道添了一把火,引發(fā)廣泛熱議。

實(shí)際上,Manus的窘境,也正是當(dāng)下部分Agent類產(chǎn)品的共同寫照。

盡管2025年被冠以“AI Agent元年”之名,Agent類產(chǎn)品迎來了爆發(fā)式增長,并涌現(xiàn)出扣子空間(Coze Space)、GenSpark、心響、心流等明星產(chǎn)品,但它們?nèi)悦媾R技術(shù)、商業(yè)化與產(chǎn)品市場契合度(PMF)等多重挑戰(zhàn)。

具體而言,Agent產(chǎn)品的開發(fā)與運(yùn)營成本高昂,但用戶付費(fèi)意愿較低,商業(yè)化模式尚未成熟。銀河證券2025年報(bào)告數(shù)據(jù)顯示,AI Agent行業(yè)的平均用戶獲取成本(CAC)高達(dá)50美元/用戶,而平均用戶生命周期價(jià)值(LTV)僅為20-30美元,表明多數(shù)產(chǎn)品仍未實(shí)現(xiàn)盈利。

此外,多數(shù)Agent產(chǎn)品體驗(yàn)未達(dá)預(yù)期、功能同質(zhì)化嚴(yán)重,導(dǎo)致用戶流失率高,難以建立長期粘性。那么在元年光環(huán)之下,AI Agent賽道是否只是一場虛假繁榮?

Part.1 繁榮下的結(jié)構(gòu)性困境AI Agent的“單點(diǎn)困局”與“組織鴻溝”

從總體來看,當(dāng)前的AI Agent市場,缺乏能真正穿越周期的、展現(xiàn)出“Agent比人類更懂執(zhí)行”的產(chǎn)品。

究其根源,在于當(dāng)前的Agent類產(chǎn)品普遍面臨著兩個(gè)深層次的結(jié)構(gòu)性問題:一是Agent類產(chǎn)品普遍為“單點(diǎn)”賦能;二則是相當(dāng)多的企業(yè),都將重心放在了打造所謂的“通用”功能上。

當(dāng)前的大多數(shù)Agent產(chǎn)品,往往專注于優(yōu)化單一任務(wù)或特定場景(如信息檢索、報(bào)表生成、任務(wù)自動(dòng)化),但缺乏對(duì)企業(yè)生產(chǎn)鏈條中多個(gè)環(huán)節(jié)的協(xié)同整合能力。這種“單點(diǎn)”賦能模式導(dǎo)致Agent在復(fù)雜、跨部門的業(yè)務(wù)流程中難以發(fā)揮“樞紐”作用。

造成這一現(xiàn)象的原因,既有技術(shù)上的短板,也有組織上的滯后。

從技術(shù)上來說,一部分Agent應(yīng)用在技術(shù)上并不成熟,在執(zhí)行涉及復(fù)雜邏輯、多步驟或調(diào)用多個(gè)工具的任務(wù)時(shí),常出現(xiàn)卡頓、失敗或耗時(shí)過長的問題。

以Manus為例,不少用戶發(fā)現(xiàn)在測試中一旦任務(wù)涉及多個(gè)工具(如文件+郵件+ Notion +云盤),Manus就常常會(huì)在執(zhí)行中卡住、步驟結(jié)果傳遞錯(cuò)誤,或耗時(shí)超過一小時(shí)。這反映出了此類Agent應(yīng)用缺少顯式記憶機(jī)制,以至在多輪對(duì)話中狀態(tài)信息經(jīng)常丟失,甚至誤用舊信息;或是各工具接口無統(tǒng)一協(xié)議,調(diào)用全靠prompt“蒙”。

而像扣子空間這樣的產(chǎn)品,在進(jìn)行“根據(jù)數(shù)據(jù)繪制圖表”的任務(wù)時(shí),完成的狀態(tài)、質(zhì)量也十分潦草,難以達(dá)到“合格”要求。

這說明現(xiàn)在相當(dāng)一部分的Agent,基本只有一層prompt調(diào)用API,缺乏一整套結(jié)構(gòu)化的、統(tǒng)一的數(shù)據(jù)接口,以及相應(yīng)的推理鏈條。

而從組織結(jié)構(gòu)上來說,當(dāng)前很多企業(yè)實(shí)際上并未完成適應(yīng)AI時(shí)代的“人機(jī)協(xié)作”轉(zhuǎn)型。

一個(gè)明顯的例子是,今年上半年,有相當(dāng)一部分企業(yè)落地了編程類Agent應(yīng)用cursor,但得到的反饋卻是此類應(yīng)用沒有顯著提效。

原因就在于,在企業(yè)的實(shí)際運(yùn)作中,一段代碼從寫出來,到真正“用得上”,往往要經(jīng)歷需求澄清、任務(wù)拆解、代碼開發(fā)、審核、測試等多個(gè)環(huán)節(jié),涉及跨部門協(xié)調(diào)。

現(xiàn)在的問題不是Agent寫得慢,而是企業(yè)沒有把Agent“嵌進(jìn)流程”中去。整條“軟件交付流水線”仍然是人主導(dǎo)的、審批制的、串聯(lián)式結(jié)構(gòu)。

結(jié)果便是AI可能節(jié)省了20%的開發(fā)時(shí)間,但流程中60%的瓶頸根本不在編碼環(huán)節(jié),而在于組織流程和人為因素。這使得Agent帶來的效率提升,在陳舊的“人治”流程面前幾乎被完全抵消,全都化作了烏有。

Part.2 Agent分野通用虛火噱頭與垂類深耕挑戰(zhàn)

在今年涌現(xiàn)的各類Agent中,不少明星產(chǎn)品如Manus、GenSpark、扣子空間等,都選擇了“通用Agent”的路線。

畢竟,與垂類Agent相比,“通用”Agent的概念聽起來更性感、想象空間更大。對(duì)投資人而言,“打造AI操作系統(tǒng)”的故事遠(yuǎn)比“開發(fā)HR報(bào)銷助手”更動(dòng)聽。早期用戶也更容易被“全能型”Agent的愿景所吸引,通用Agent看似更先進(jìn)、更全能,更能制造FOMO效應(yīng)。

然而,現(xiàn)實(shí)與愿景存在明顯落差,當(dāng)前的通用Agent技術(shù)形態(tài)更像一個(gè)中等智力的虛擬助理,難以勝任系統(tǒng)調(diào)度、權(quán)限管理等核心職能。

對(duì)于個(gè)人用戶,通用Agent目前處境尷尬。其解決的往往是瑣碎事務(wù),如點(diǎn)外賣、訂酒店、生活規(guī)劃,這些需求本身痛點(diǎn)不深,它們通常不緊急、評(píng)估標(biāo)準(zhǔn)模糊。

用戶在這些場景中更關(guān)注“心態(tài)”與“體驗(yàn)”,而非純粹的“效率”。例如在點(diǎn)外賣時(shí),人們往往更在意點(diǎn)哪家外賣,而不是下單速度。

與之相比,一些專注于“專、窄、深”的垂直領(lǐng)域、聚焦于解決企業(yè)具體痛點(diǎn)的AI Agent,反而在今年獲得了相當(dāng)程度的成功。

例如在金融行業(yè)中,Muffintech作為保險(xiǎn)客服Agent,能夠自動(dòng)處理常見客服查詢(如保單狀態(tài)),回復(fù)準(zhǔn)確率98%,并將理賠審批時(shí)間縮短至1天,為保險(xiǎn)公司年節(jié)省500萬美元。

在法律行業(yè),聚焦于文書起草的Harvey,專注解決法律文書起草痛點(diǎn),如手動(dòng)研究耗時(shí)長(每案平均20小時(shí))、文書起草錯(cuò)誤率高,實(shí)現(xiàn)自動(dòng)分析法律案例和法規(guī)并生成研究報(bào)告,準(zhǔn)確率90%,為律所帶來了直觀的效率提升。

盡管這些垂類Agent看上去樸實(shí)無華,技術(shù)上也并不十分復(fù)雜,但也并非任何一家企業(yè)都能輕易照搬,其中存在多重門檻和難點(diǎn)。

垂直領(lǐng)域需要大量且收集門檻頗高的行業(yè)數(shù)據(jù),模型必須針對(duì)特定場景進(jìn)行微調(diào)或重新訓(xùn)練。

例如,制造業(yè)的Agent需要處理傳感器數(shù)據(jù),法律Agent需要生成符合邏輯的文書,這些任務(wù)對(duì)準(zhǔn)確率要求極高。

這使得模型團(tuán)隊(duì)不僅要精通AI技術(shù),還要熟悉行業(yè)知識(shí),這類復(fù)合型人才非常稀缺且招聘成本高昂。

同時(shí),垂類Agent需要與企業(yè)現(xiàn)有的行業(yè)標(biāo)準(zhǔn)系統(tǒng)(如SAP、Salesforce)無縫對(duì)接,以實(shí)現(xiàn)數(shù)據(jù)共享和流程優(yōu)化。

然而,許多企業(yè)內(nèi)部存在數(shù)據(jù)孤島問題,跨系統(tǒng)集成需要開發(fā)定制API,這需要團(tuán)隊(duì)具備系統(tǒng)架構(gòu)設(shè)計(jì)和行業(yè)軟件集成的經(jīng)驗(yàn),對(duì)技術(shù)能力要求極高。

對(duì)技術(shù)、行業(yè)知識(shí)的高要求,使得大部分中小企業(yè)難以打造出有競爭力的垂類Agent。

現(xiàn)階段,包括BAT、字節(jié)在內(nèi)的大廠,都擅長做平臺(tái)和demo,例如阿里的釘釘+夸克、百度的千帆App Builder等,但真正把復(fù)雜垂直業(yè)務(wù)完成端到端改造的案例并不多,大部分還是小規(guī)模試點(diǎn)或簡單輔助。此外,很多企業(yè)做了大量POC(概念驗(yàn)證),但真正投入規(guī)模化使用的很少。

根據(jù)ThoughtWorks報(bào)告披露,因?yàn)闃I(yè)務(wù)協(xié)同不足與運(yùn)營成本高,高達(dá)88%的AI POC未能進(jìn)入大規(guī)模部署。研究發(fā)現(xiàn),每家公司推出的33個(gè)AI概念驗(yàn)證項(xiàng)目中,只有4個(gè)能夠進(jìn)入生產(chǎn)階段。

究其原因是互聯(lián)網(wǎng)大廠更擅長做“通用能力+流量和平臺(tái)”,而真正把垂類行業(yè)的臟活、定制、合規(guī)、實(shí)施做到位,則需要線下深耕與行業(yè)Know-How積累,這和它們的業(yè)務(wù)屬性、考核體系和商業(yè)動(dòng)力并不十分匹配。

Part.3 跨越市場鴻溝出海抉擇與本土價(jià)值驗(yàn)證

除了前面提到的兩大結(jié)構(gòu)性問題,Agent產(chǎn)品自誕生之初便面臨著一個(gè)揮之不去的商業(yè)化難題,即國內(nèi)與國際市場的深度割裂。

對(duì)國內(nèi)大部分AI企業(yè)來說,“合規(guī)性”要求下使其發(fā)展高度依賴國產(chǎn)模型能力,然而國產(chǎn)模型與美國頂尖模型之間仍存在代際差距。

與國內(nèi)模型相比,Claude Opus 4 等國外先進(jìn)模型,在復(fù)雜推理鏈條,尤其是跨領(lǐng)域、多條件推導(dǎo)上往往能保持更穩(wěn)定的邏輯一致性,出錯(cuò)率更低。

且在上下文長度上,也已做到百萬級(jí)別。在嚴(yán)格按照格式、生成長且結(jié)構(gòu)化的文檔、代碼、JSON 等方面穩(wěn)定性頗高,這些都是當(dāng)前國內(nèi)模型尚難實(shí)現(xiàn)的水準(zhǔn)。

同時(shí),受限于國內(nèi)整體數(shù)字化程度與消費(fèi)習(xí)慣,現(xiàn)階段B端、C端用戶的付費(fèi)意愿皆不理想。這使得消費(fèi)級(jí)AI應(yīng)用,尤其是初創(chuàng)產(chǎn)品,價(jià)值更難以被市場充分認(rèn)可并實(shí)現(xiàn)商業(yè)化。

在這樣的大前提下,國內(nèi)AI應(yīng)用創(chuàng)業(yè)者需要付出更大的努力,來彌補(bǔ)模型能力與市場期望間的價(jià)值差距。這意味著團(tuán)隊(duì)在場景設(shè)計(jì)、數(shù)據(jù)工程、模型理解、市場和業(yè)務(wù)認(rèn)知等綜合能力上,需具備更加深厚的積淀。

在“高投入、低價(jià)值”的壓力下,Manus這樣的Agent產(chǎn)品選擇出海成為情理之中的策略。

據(jù)海外AI創(chuàng)業(yè)者透露,海外市場對(duì)AI產(chǎn)品的估值更為慷慨,1萬日活即可支撐1億美元估值。也就是說,1個(gè)日活用戶就價(jià)值7萬人民幣。

盡管如此,出海也并非終極解藥。所有Agent產(chǎn)品都逃不過模型能力的比拼。

隨著2025年OpenAI、Anthropic等巨頭紛紛開始布局自有的Agent產(chǎn)品,為了保持競爭優(yōu)勢采取“模型斷供”策略,將使套殼類Agent的優(yōu)勢迅速瓦解。

例如前段時(shí)間,海外著名的AI編程應(yīng)用Windsurf,就遭到了Claude的全面斷供,這反映出了很多沒有自研模型的企業(yè)(包括Manus),在巨頭面前的脆弱性。

因此,出海應(yīng)該是“活下去+練能力”的階段性策略,不是“一去不返”的終局。

而在國內(nèi)市場,資本們留給Agent賽道的耐心亦不會(huì)太久。盡管垂直領(lǐng)域大模型及應(yīng)用廠商口號(hào)不斷、標(biāo)桿案例宣傳頻出,但Agent未來能創(chuàng)造多少真實(shí)經(jīng)濟(jì)效益,仍是個(gè)未知數(shù)。

但可以肯定的是,目前的Agent已經(jīng)在客服、營銷、數(shù)據(jù)分析等流程明確、規(guī)則固定的場景里,切實(shí)展現(xiàn)出降本增效的價(jià)值。有這些商業(yè)化場景托底,Agent在今年就不會(huì)全然是一個(gè)“泡沫”。

而未來更大的商業(yè)化突破,則有待Agent在某些高價(jià)值的垂類領(lǐng)域,例如金融、醫(yī)療等場景真正發(fā)揮出變革性作用,而這則需要技術(shù)演進(jìn)、組織適配與產(chǎn)業(yè)生態(tài)協(xié)同等多種因素協(xié)同作用。

END

       原文標(biāo)題 : Agent 2025:AI的窄門與寬路

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)