訂閱
糾錯(cuò)
加入自媒體

終于,GPT-5發(fā)布了,也被噴慘了

圖片

 

劃重點(diǎn):

1、期盼2年的GPT-5終于在如期而至,超過那些全球最聰明的大模型,達(dá)到博士水平。

2、GPT-5目前已面向普通用戶提供免費(fèi)、plus和Pro三種模式;同時(shí)在API平臺上,推出了GPT-5、GPT-5 nano、GPT-5 mini三種模型選擇。

3、OpenAI直播期間出現(xiàn)重大失誤,播出的性能圖表被網(wǎng)友怒噴。 

作者 常遠(yuǎn)

編輯 重點(diǎn)君

GPT-5,終于在深夜出爐。

以為很震驚,以為很驚艷???確實(shí)有。

但先來看一張圖:

圖片

OpenAI到底是如何做到在全球直播的場合展示Benchmark,竟然能把52.8顯示得比69.1都高,甚至這個(gè)69.1能跟30.8平齊的???

其它的不談,單就這一點(diǎn),開場直接號稱“博士水平”AI,就這么水靈靈地“按需縮放”坐標(biāo)系,也是引得網(wǎng)友怒噴不已。

圖片

甚至Altman都趕忙出來轉(zhuǎn)移話題,稱技術(shù)博客上是正確的……

圖片

確實(shí),技術(shù)博客確實(shí)是有所更正。

圖片

但如此失誤,著實(shí)不應(yīng)該,畢竟大家都等了2年!

   博士水平的AI,來了

不過有一說一,除了這個(gè)被大眾詬病的致命失誤之外,GPT-5在現(xiàn)場的表現(xiàn)還算是可圈可點(diǎn)。

在技術(shù)博客中,OpenAI開場直接一句:“迄今為止,這是我們最智能、最快速、最實(shí)用的模型,內(nèi)置的思考能力讓每個(gè)人都能擁有專家級智能。”

這次發(fā)布的GPT-5擁有四個(gè)版本:

GPT-5:在不同領(lǐng)域中進(jìn)行Coding和執(zhí)行任務(wù)的標(biāo)準(zhǔn)模式;

GPT-5 mini:輕量版版本,適用于對明確界定的任務(wù)和場景;

GPT-5 nano:強(qiáng)調(diào)運(yùn)行速度和性價(jià)比;

GPT-5 Chat:ChatGPT中使用的版本。

GPT-5目前已面向普通用戶提供免費(fèi)、plus和Pro三種模式。

同時(shí)在API平臺上,推出了GPT-5、GPT-5 nano、GPT-5 mini三種模型選擇。

不僅如此,承接昨天時(shí)隔6年的開源,OpenAI表示這次GPT-5面向所有人,免費(fèi)!并且是博士水平的那種。

我們先來看下Benchmark。

最讓人吸睛的,還是GPT-5在AIME 2025的表現(xiàn),直接拿下滿分的成績。

圖片

其次就是編程能力,相較于o3和4o,GPT-5在思考模式加持之下,達(dá)到了74.9%的水平。

圖片

除此之外,這個(gè)模型在多種多模態(tài)評測中表現(xiàn)出色,覆蓋了圖像、視頻、空間理解和科學(xué)推理等方面。

更強(qiáng)的多模態(tài)能力,意味著ChatGPT在處理圖片和其他非文字信息時(shí)更聰明了——比如看懂圖表、總結(jié)一張演示照片的內(nèi)容,或者回答關(guān)于圖示的問題。

圖片

而且比較罕見的是,第三方的大模型競技場(Imarena.ai)也是及時(shí)跟進(jìn),直接發(fā)聲表明:“全方面第一”。

具體而言,競技場涉及的內(nèi)容包括:文本、Web開發(fā)、視覺、編程、數(shù)學(xué)、創(chuàng)造力、長查詢等。

圖片

由此可見,GPT-5從目前評測標(biāo)準(zhǔn)來看,確實(shí)是AI大模型的衛(wèi)冕之王。

   再看效果

成績是一方面,但實(shí)際效果才是硬道理。

深諳此理的Sam Altman在自己的X賬號上也是立馬跟進(jìn),發(fā)布了由GPT-5生成的效果:

圖片

并且Altman還表示,有GPT-5權(quán)限的用戶,只需發(fā)送“use beatbot to make a sick beat to celebrate gpt-5”即可體驗(yàn)。

不多不說,營銷這塊,Altman還是非常手拿把掐的。

不過在直播的現(xiàn)場演示過程中,GPT-5還是有不少驚艷的表現(xiàn)在身上的。

例如讓GPT-5生成一個(gè)學(xué)語法的APP,效果是這樣的:

圖片

不要以為是簡單的網(wǎng)站,除了可以完成市面上AI的交互之外,它在里面還可以內(nèi)嵌一個(gè)小游戲(點(diǎn)擊“Mouse&Cheese”):

圖片

并且若是想改變APP里面的內(nèi)容,只要一句話,瞬間(現(xiàn)場實(shí)測)就可以改變布局:

圖片

對于更加龐大且復(fù)雜的項(xiàng)目,例如現(xiàn)場OpenAI展示了用GPT-5先編程出來的代碼:

圖片

在運(yùn)行之后,便得到了一個(gè)3D效果的“世界”:

圖片

總而言之,從現(xiàn)場效果來看,GPT-5也是擔(dān)得起“最聰明、最強(qiáng)編程”的大模型。

   “觀眾”們買單嗎?

從目前X上“觀眾”的反饋來看,討論最激烈的就是前面我們提到的圖表bug。

甚至有網(wǎng)友做了一張簡單粗暴的Excel表格來諷刺這次的失誤:

圖片

不過另一方面,老東家微軟CEO火速出面站臺,并配有一個(gè)“愛心”圖片以表支持:

圖片

再如開發(fā)者們常用的VS Code,官方也是Day 0無縫銜接GPT-5:

圖片

不過對于普羅大眾來說,反饋聲音最大的莫過于:“說好的免費(fèi),我的ChatGPT咋沒有呢?”

總而言之,用戶到底買不買單,實(shí)測效果到底有沒有那么神,需要讓子彈再飛一會了。

參考鏈接:

       原文標(biāo)題 : 終于,GPT-5發(fā)布了,也被噴慘了

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號