GPT-5亮相,“博士專家”是不是真的Agent?
“ 不是巨人邁步,也是一腳穩(wěn)落的新臺階。”
文 | 王嫻
出品 | 極新
OpenAI CEO Sam Altman 在發(fā)布會上將GPT-5 形容為“一位隨時待命的博士級專家”,并提出“按需生成軟件”將成為這一代模型的核心能力。
或許GPT-5 不再只是更強的語言模型,而是邁向通用Agent的關(guān)鍵節(jié)點。
01 技術(shù)新亮點
盡管 GPT-5 的微調(diào)能力尚未達到外界對其“通用智能”層面的高期待,但在性能穩(wěn)定性、推理深度以及工具調(diào)用等方面,仍展現(xiàn)出值得肯定的進步。
關(guān)鍵詞一:模型矩陣
OpenAI不再只提供單一模型,而是推出了GPT-5 Standard、GPT-5 Mini和GPT-5 Nano等多個版本,針對不同用戶場景分別優(yōu)化 。
在架構(gòu)上,GPT-5采用了統(tǒng)一的多模型系統(tǒng):高效基礎模型 + 深度推理模塊 + 實時路由。實時路由器會根據(jù)用戶查詢的復雜度,自動判定調(diào)用快速響應的模型。這種動態(tài)調(diào)度意味著用戶不必手動在不同模型之間切換,GPT-5能自動選擇簡潔回答或深入推理,提供解答 。一位OpenAI負責人指出,目標是在簡化用戶體驗的同時保證一致性,過去GPT-4與DALL-E、Whisper等模型分立的局面將被一個“一站式”的GPT-5所取代 。
且其價格穿透力,被譽為“價格屠夫”,據(jù)統(tǒng)計僅相當于Anthropic最新Claude Opus 4.1模型的十五分之一 。新一輪普惠化競賽或?qū)⒂纱碎_始。
關(guān)鍵詞二:上下文窗口的巨幅提升
GPT-5支持高達400,000個token的上下文長度,其中輸入272,000個、輸出128,000個token 。這遠超此前GPT-4默認的8K-32K窗口,甚至超過Gemini據(jù)傳的100萬token上下文 。超長上下文讓GPT-5可處理超長文檔和多輪復雜對話,執(zhí)行跨文件、跨會話的推理任務而游刃有余。
同時GPT-5具備完整的多模態(tài)能力:文字、圖像、語音甚至可能包括視頻,都能在同一接口下被理解和生成 。用戶不再需要在不同AI服務之間來回切換,一個GPT-5即可“通吃”視覺與聽覺信息。
關(guān)鍵詞三:更智能的推理策略
除了“看得見”的能力提升,GPT-5在隱性的推理策略上也更智能。
OpenAI介紹GPT-5能根據(jù)需求調(diào)整推理強度:簡單任務快速出結(jié)果,遇到復雜問題則自主進入“深思考”模式,提高思考深度 。例如在代碼調(diào)試場景下,GPT-5可以先嘗試快速修復,如不奏效再逐步加深分析,避免每次都全功率運行浪費算力。這種自適應的智能調(diào)度歸功于內(nèi)置的路由模塊和鏈式推理優(yōu)化,讓模型懂得權(quán)衡速度與精度。再結(jié)合OpenAI宣稱的幻覺率降低(錯誤生成降低45% )以及對指令的更高忠實度,GPT-5無疑將AI助手的可靠性推上了新的臺階。
02 距真正的AI Agent還有多遠?
發(fā)布會上,Altman雖然淡化了AGI概念,但行業(yè)共識是:GPT-5已比肩初級Agent雛形——它具備了鏈式思考、多步執(zhí)行和工具調(diào)用等Agent關(guān)鍵要素。
然而,要判斷GPT-5是否真正成為智能Agent,我們需要審視其能力邊界和短板。
從能力上看,GPT-5較前代在自主性和持續(xù)推理方面有明顯進步。OpenAI專門針對模型的自主決策、協(xié)作溝通和測試能力進行了微調(diào)訓練,使GPT-5在執(zhí)行復雜任務時更加主動。以編碼助手為例,GPT-5可以連續(xù)工作數(shù)分鐘,調(diào)用多種工具來完成一個復雜編程指令,期間會主動輸出計劃、步驟和狀態(tài)更新,“一GPT一人一公司”,指日可待。
過去模型往往一問一答,被動等待指令,而GPT-5在工具調(diào)用間隙會提出下一步建議,無需用戶事無巨細地確認每一步 。這種近似Agent的鏈式思維和自主執(zhí)行,使其在復雜場景下的表現(xiàn)大幅提升。據(jù)測試,GPT-5的深度推理模塊(GPT-5-thinking)可用更少的tokens完成復雜問題,比前代模型減少50%-80%的步驟開銷。這表明GPT-5已經(jīng)初步具備了長鏈任務規(guī)劃和優(yōu)化執(zhí)行的能力。
更重要的是工具使用能力的飛躍。OpenAI報告稱,GPT-5在嚴格評測的多工具使用基準τ^2-bench上得分高達97%,而此前所有模型均未超過49%。GPT-5能可靠地串聯(lián)多個操作步驟完成真實世界任務。例如在客戶服務場景,GPT-5可以一邊與用戶對話,一邊調(diào)用數(shù)據(jù)庫查詢,再根據(jù)實時狀態(tài)采取后續(xù)行動,其對工具指令的遵循度和出錯處理能力均創(chuàng)下紀錄。這些結(jié)果證明,GPT-5已掌握了相當程度的Agent式工具調(diào)度與環(huán)境交互本領(lǐng),朝著通用智能體又邁進一步。
然而,GPT-5離真正的自主智能Agent仍有關(guān)鍵差距。
OpenAI自己也承認,GPT-5在持久記憶、自主性和跨任務適應性上依然存在明顯限制 。它無法像人一樣持續(xù)積累長期記憶——一旦超出400K上下文,它對更久遠交互的“記憶”依然會丟失,需要借助外部數(shù)據(jù)庫或記憶模塊。
在自主性上,雖然GPT-5更主動,但終究還是遵循人類提示觸發(fā),尚不能自主產(chǎn)生新目標或自行啟動任務。它執(zhí)行多步流程時雖更流暢,但對未明確指示的新情景,缺乏真正的創(chuàng)造性應對,這在模擬真人智能方面仍有差距。這從一些測試可以看出端倪:在被譽為AGI終極挑戰(zhàn)的Arc Prize測試中,GPT-5表現(xiàn)遠不及對手Grok-4,甚至“被人類專家輕松甄別”。OpenAI發(fā)言人也強調(diào),GPT-5的新功能主要是現(xiàn)有功能改進,并未徹底解決自主性難題 。
不過,可以確定的是:Agent時代,GPT-5也許只差臨門一腳。
03 OpenAI的下一戰(zhàn)
OpenAI 此次五模齊發(fā)的背后,已經(jīng)折射出其構(gòu)建“AI 操作系統(tǒng)”式平臺架構(gòu)的野心。
GPT-5 不再是單一模型,而是一個由多種規(guī)格協(xié)同組成的“模型矩陣”,可根據(jù)任務復雜度動態(tài)調(diào)用“深度思考”或高效輕量模型。“GPT-5 大賭注在于合一。”Sam Altman指出,GPT-5 實現(xiàn)了從 GPT-4 手動切換到系統(tǒng)自動路由的架構(gòu)升級,真正做到“合一”。同時推出的 GPT-5-mini 和 GPT-5-nano 以更低成本提供 400K 上下文和多模態(tài)能力,OpenAI 試圖通過高低搭配,覆蓋全場景智能需求。
如果說多型號矩陣是“AI 操作系統(tǒng)”的內(nèi)核,那么 OpenAI 正在搭建的周邊生態(tài)則是操作系統(tǒng)的“框架和接口”。其 Assistants API(助理接口)讓開發(fā)者能夠構(gòu)建定制的 GPT 助手,將模型變成可嵌入任意應用的智能Agent;ChatGPT 插件充當擴展工具,為 GPT 提供調(diào)用外部服務和實時數(shù)據(jù)的能力,如同AI世界的應用商店;而定制模型接口則意味著開發(fā)者可以接入自有模型或定制版本,與OpenAI平臺打通。
Sam Altman的愿景更加直白。他曾表示OpenAI的目標不是成為某個應用上的贏家,而是要“成為其他一切構(gòu)建其上的那一層” 。換言之,OpenAI 希望充當AI時代的底層平臺,讓別的應用都建立在自己的“AI操作系統(tǒng)”之上。
為此,OpenAI 正不斷豐富平臺組件:從最新的 GPT-5 模型矩陣,到插件體系、助理API,再到開放模型發(fā)布。
一方面,ChatGPT 已從最初的對話機器人躍升為集成搜索引擎、插件工具等于一身的“AI萬能應用” ;另一方面,OpenAI 開始松動封閉策略,首度開源高性能模型,發(fā)布了自 GPT-2 以來首批開放權(quán)重的大模型gpt-oss 系列,允許開發(fā)者免費下載、定制和離線運行 。
這被視為OpenAI 向構(gòu)建生態(tài)邁出的關(guān)鍵一步:通過 Apache 2.0 開源許可證將自家模型“交到更多人手中” ,以吸引開發(fā)者深度參與,夯實其平臺地基。
歷史的回響:封閉崛起還是碎片開放
各家大模型之爭,讓人不由想起科技史上的多次“宿命對決”。
智能手機時代,蘋果憑借封閉的軟硬件一體化為用戶帶來極佳體驗和高粘性生態(tài),建立起牢固的盈利壁壘;而谷歌主導的Android開放授權(quán)給眾多廠商,贏得了市場占有率但也付出碎片化和生態(tài)良莠不齊的代價。
類似的劇情正投射到AI領(lǐng)域:OpenAI模式頗似當年的蘋果,通過性能拔尖的GPT-5模型和自有平臺把關(guān)用戶體驗,以封閉換取質(zhì)量和商業(yè)回報;Anthropic、Meta等提倡的開源開放更像Android陣營,意圖聯(lián)合多數(shù)、快速鋪開,讓“AI大國民”遍地開花,但同時如何治理眾多版本和標準成為挑戰(zhàn)。
過往多次經(jīng)驗顯示,封閉生態(tài)往往在早期憑借卓越體驗迅速崛起,而開放生態(tài)則憑借規(guī)模和低門檻后來居上。AI操作系統(tǒng)之爭會重演這一幕嗎?抑或會走出第三條道路?這是大家十分關(guān)心的問題。
云計算領(lǐng)域,亞馬遜AWS以IaaS起家,但真正讓其難以撼動的是一系列PaaS產(chǎn)品:開發(fā)者一旦使用了AWS提供的數(shù)據(jù)庫、消息隊列、函數(shù)計算等托管服務,就被牢牢綁定在AWS生態(tài)中。對照來看,OpenAI 顯然也在從“提供模型算力”向“提供完整平臺服務”演進。
當年有人將AWS稱為“新操作系統(tǒng)”,因為應用直接基于其API構(gòu)建而不感知底層服務器;今天,OpenAI 何嘗不是在打造AI時代的新操作系統(tǒng)?開發(fā)者調(diào)用的是OpenAI的接口,背后用的模型、算力甚至插件生態(tài)都由OpenAI打包提供。如果說AWS壟斷了云端基礎設施接口,那么OpenAI正嘗試壟斷AI智能層接口。
值得注意的是,AWS生態(tài)的壯大并非依靠開源,而是靠易用性與先發(fā)優(yōu)勢形成事實標準。OpenAI的策略與此有異曲同工之妙:搶先占領(lǐng)市場心智,讓GPT API和插件成為開發(fā)者默認選項,即便后來的競爭對手開放源碼或降價,已難以扳動其生態(tài)地位。
當然,歷史類比并非預言。移動生態(tài)最終是雙雄并立,云計算領(lǐng)域后來者微軟Azure、谷歌云也各有一席之地。
當下AI平臺大戰(zhàn)格局更為復雜:巨頭結(jié)盟與競爭交織,開放與封閉界限日趨模糊;蛟S未來的AI世界,不會簡單復制某一過往戰(zhàn)役的結(jié)局,但商業(yè)與技術(shù)演進的底層邏輯卻驚人相似:用戶體驗、開發(fā)者生態(tài)、標準控制,這三大要素始終決定著平臺戰(zhàn)爭的走向。
OpenAI 究竟是在打造一個人工智能的“操作系統(tǒng)”,還是野心勃勃地想要定義整個AI技術(shù)棧、云服務乃至應用范式的未來?這場“模型即平臺,接口即邊界”的群雄逐鹿才剛剛開始,答案有待時間去揭曉,懸念也留給我們所有人去思考 。
AI江湖的下一個篇章,值得我們拭目以待。
原文標題 : GPT-5亮相,“博士專家”是不是真的Agent?

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字