微軟進(jìn)軍 AI 瀏覽器,維持巨頭的平庸
Edge 能讀懂網(wǎng)頁(yè)了,僅此而已。
作者|薛星星
編輯|蔣澆
封面|Edge 截圖
經(jīng)過(guò)了兩年對(duì) Edge 瀏覽器 AI 功能的小修小補(bǔ)之后,微軟在今天為 Edge 瀏覽器加入 Copilot 模式,正式進(jìn)軍 AI 瀏覽器市場(chǎng)。
具體來(lái)說(shuō),Edge 瀏覽器中的 AI 功能不再像以前一樣只是一個(gè)聊天側(cè)邊欄,新推出的 Copilot 模式可以讓 AI 閱讀和理解網(wǎng)頁(yè)內(nèi)容,比如幫你做一個(gè)技術(shù)文檔頁(yè)面的解讀或者 Youtube 視頻的觀看大綱。
它也可以一次性瀏覽所有你已打開(kāi)的網(wǎng)頁(yè),當(dāng)你在多個(gè)商品或者酒店頁(yè)面來(lái)回切換煩惱時(shí),幫你列一個(gè)對(duì)比表格來(lái)輔助決策。微軟還增加了語(yǔ)音功能,你可以通過(guò)語(yǔ)音聊天來(lái)理解網(wǎng)頁(yè)、和 AI 實(shí)時(shí)對(duì)話。
這些功能看上去與市面上已有的 AI 瀏覽器好像沒(méi)什么不同,但微軟 CEO 薩提亞·納德拉(Satya Nadella)對(duì)此贊不絕口,“這是我們?yōu)?AI 時(shí)代重新定義瀏覽器的第一步。”他說(shuō)他最喜歡 multi-tab RAG 功能,可以讓他更快地分析微軟過(guò)去一年在 Nature 上發(fā)表的論文——介紹新功能的同時(shí)順帶炫耀一番。
目前該功能尚處實(shí)驗(yàn)階段,微軟稱將會(huì)逐漸為 Copilot 模式加入新功能。實(shí)驗(yàn)的另一層含義是現(xiàn)在 Copilot 模式為“限時(shí)免費(fèi)”?紤]到目前 Copilot 仍由 OpenAI 提供基礎(chǔ)模型支持,這意味著你可以免費(fèi)使用不少 ChatGPT 的付費(fèi)功能。
比如你可以在 Copilot 模式下使用 ChatGPT 中付費(fèi)的 DeepResearch 功能。納德拉還透露他們將推出任務(wù)代理功能,讓用戶在瀏覽網(wǎng)頁(yè)的同時(shí)委托 Copilot 處理任務(wù)。一位 AI 創(chuàng)業(yè)者將其稱之為 ChatGPT Agent 的免費(fèi)替代版。ChatGPT Agent 目前僅向 Plus 及以上用戶開(kāi)放,最低月付費(fèi) 20 美元。
這大概也是當(dāng)前 Edge 相較其他 AI 瀏覽器最大的吸引力了。在 OpenAI 還沒(méi)正式推出自家瀏覽器之前,你可以在 Edge 中使用平替版的 ChatGPT——算是為山姆·阿爾特曼(Sam Altman)脫離微軟又提供了一個(gè)借口。
Edge 能讀懂網(wǎng)頁(yè)了,但也僅此而已
和 2023 年最初宣布 Edge 瀏覽器向 AI 轉(zhuǎn)型一樣,微軟官網(wǎng)發(fā)布的產(chǎn)品更新中對(duì) Copilot 模式依然添加了不少宏大的名詞概念,諸如“我們正見(jiàn)證著網(wǎng)絡(luò)互動(dòng)方式的轉(zhuǎn)折點(diǎn)”“這是我們進(jìn)一步探索更強(qiáng)大網(wǎng)頁(yè)瀏覽方式的下一步”等等。
但用戶打開(kāi) Copilot 模式之后,最明顯的感知或許就是主頁(yè)界面變成了一個(gè) Copilot 對(duì)話框,微軟稱之為“整合了對(duì)話、搜索和網(wǎng)頁(yè)導(dǎo)航”,敲入關(guān)鍵詞時(shí)可以啟用 Bing 搜索也可以直接與 Copilot 對(duì)話。
微軟在產(chǎn)品文檔中介紹,Copilot 可以理解用戶意圖,幫助用戶更高效地理清信息,不再被龐雜的標(biāo)簽頁(yè)面困擾。你在瀏覽網(wǎng)頁(yè)時(shí),也可以隨時(shí)調(diào)出地址欄左側(cè)的 Copilot 提問(wèn),Copilot 還可以根據(jù)用戶的歷史記錄,預(yù)測(cè)用戶下一步操作給出建議。
以前段時(shí)間 Manus 在官網(wǎng)發(fā)布的 AI Agent 上下文工程的技術(shù)文檔為例。打開(kāi)網(wǎng)頁(yè),Copilot 可以理解網(wǎng)頁(yè)內(nèi)容,為用戶提供文檔解讀或大綱。它似乎也可以理解視頻內(nèi)容,比如對(duì)一則 Youtube 視頻進(jìn)行要點(diǎn)整理,生成視頻摘要。
Copilot 總結(jié)網(wǎng)頁(yè)內(nèi)容
Copilot 總結(jié) Youtube 視頻
針對(duì)電商網(wǎng)站,Copilot 還可以根據(jù)商品詳情頁(yè)進(jìn)行 AI 總結(jié),還會(huì)提供歷史價(jià)格走勢(shì)圖、與其他網(wǎng)站進(jìn)行比價(jià)等。不過(guò)這項(xiàng)功能僅適應(yīng)于亞馬遜、Shein 等海外購(gòu)物網(wǎng)站,國(guó)內(nèi)淘寶、京東等電商網(wǎng)站尚不支持。
Copilot 總結(jié)商品頁(yè)面
但這些只能算是 AI 瀏覽器的基礎(chǔ)能力。國(guó)內(nèi)的夸克、豆包乃至 QQ 瀏覽器也有類似功能,夸克的 AI 總結(jié)會(huì)將原有網(wǎng)頁(yè)轉(zhuǎn)換閱讀模式,豆包也可以對(duì) B 站上的視頻進(jìn)行分析整理,QQ 瀏覽器還推出了網(wǎng)頁(yè)搜索與模型對(duì)話的雙屏功能。更不客氣點(diǎn),你在 Chrome 上安裝一個(gè) AI 插件就可以獲得近似體驗(yàn),還能自定義模型。
Copilot 模式更顯著的區(qū)別是它具備了主動(dòng)能力,比如 AI tab grouping,可以自動(dòng)按主題將你的標(biāo)簽頁(yè)歸組。又或者納德亞口中的 multi-tab RAG 功能,它可以讓 AI 瀏覽用戶已打開(kāi)的所有標(biāo)簽頁(yè)內(nèi)容,無(wú)論你是在閱讀論文、比較酒店或者瀏覽新聞,都可以快速啟用這一功能,“讓你的瀏覽器變成一個(gè)幫助你輕松比較、決策和完成任務(wù)的工具。”
《山上》實(shí)測(cè)了包括淘寶、京東以及亞馬遜等多個(gè)國(guó)內(nèi)外的電商網(wǎng)站,Copilot 都可以整理多個(gè)不同平臺(tái)、網(wǎng)頁(yè)的商品型號(hào)、賣點(diǎn)、價(jià)格、評(píng)價(jià)等,給出一個(gè)詳細(xì)的購(gòu)買建議。此前國(guó)內(nèi)密集更新的 AI Agent 產(chǎn)品,多數(shù)也都能實(shí)現(xiàn)類似功能。
Copilot 總結(jié)天貓商品頁(yè)面并給出購(gòu)買建議
但也僅此而已了,和市面上所有號(hào)稱 Agent 能力的產(chǎn)品一樣,Copilot 并沒(méi)有打通支付環(huán)節(jié),無(wú)論是預(yù)定酒店、購(gòu)買商品還是規(guī)劃行程,它都無(wú)法實(shí)現(xiàn)微軟宣傳片中的無(wú)縫體驗(yàn),這些功能都還是期貨。
Copilot 也可以閱讀 PDF 文檔。打開(kāi)阿里巴巴的 2024 年的季度財(cái)報(bào),Copilot 會(huì)閱讀文檔內(nèi)容并給出針對(duì)性的回答。它還接入了 OpenAI 的文生圖能力,連續(xù)對(duì)話后它會(huì)詢問(wèn)你是否需要將財(cái)務(wù)數(shù)據(jù)整理成可視化圖表。只是仍然沒(méi)法直接使用,圖表中有不少錯(cuò)誤,比如完全丟掉了阿里巴巴 2024 年第一季度的業(yè)績(jī)——它只閱讀了三個(gè)網(wǎng)頁(yè)。
Copilot 閱讀 PDF 財(cái)報(bào)
在語(yǔ)音模式的加入下,微軟為 Copilot 模式增加了一個(gè)頗具科幻感的 Vision 功能。你可以用語(yǔ)音與 Copilot 實(shí)時(shí)對(duì)話,無(wú)論你正在瀏覽什么網(wǎng)頁(yè),都可以直接語(yǔ)音提問(wèn)“這段在說(shuō)什么”或者“這張圖片是什么”。“它會(huì)看到你當(dāng)前的頁(yè)面,與你一起閱讀,一起討論你面臨的難題。你不會(huì)再有獨(dú)自一人面對(duì)所有標(biāo)簽頁(yè)的孤獨(dú)體驗(yàn)。”微軟此前的產(chǎn)品文檔中說(shuō)。
但這項(xiàng)能力同樣不算新鮮。Perplexity 本月初發(fā)布的 Comet 瀏覽器同樣支持語(yǔ)音實(shí)時(shí)交互,但目前 Comet 初期僅向 Perplexity Max 訂閱用戶($200/月)及部分邀請(qǐng)用戶開(kāi)放,尚未全量鋪開(kāi)。
豆包桌面版同樣具備類似功能,但在 Mac 系統(tǒng)下必須打開(kāi)屏幕共享權(quán)限,將整個(gè)桌面畫(huà)面共享給 AI,而 Edge 無(wú)需打開(kāi)屏幕共享!渡缴稀穼(shí)測(cè)發(fā)現(xiàn),豆包的語(yǔ)音互動(dòng)無(wú)法實(shí)時(shí)對(duì)話打斷,只能通過(guò)手動(dòng)點(diǎn)擊屏幕打斷,互動(dòng)性不強(qiáng)。與之相比,即便在國(guó)內(nèi)網(wǎng)絡(luò)環(huán)境訪問(wèn)下,Copilot Vision 的反應(yīng)速度也更快、回答更精準(zhǔn),同時(shí)也可以實(shí)時(shí)打斷,交互體驗(yàn)更接近即時(shí)溝通。
忘掉那些 AI 博主們高呼的網(wǎng)頁(yè)瀏覽形式變了的口號(hào)吧,就當(dāng)下的體驗(yàn)而言,Copilot 模式的許多功能與現(xiàn)有 AI 瀏覽器沒(méi)有什么不同。微軟強(qiáng)調(diào) Copilot 仍處于實(shí)驗(yàn)階段,他們?nèi)詫⒗^續(xù)增加新功能,用戶也可自行選擇打開(kāi)或者關(guān)閉。
混戰(zhàn)的 AI 瀏覽器,還沒(méi)到終極形態(tài)
與今年上半年的通用 AI Agent 概念相比,AI 瀏覽器是一個(gè)更早也更快進(jìn)入到人們視野的產(chǎn)品。最早的 AI 瀏覽器大多只是在瀏覽器中內(nèi)置了部分 AI 能力,提供基礎(chǔ)的 AI 對(duì)話或網(wǎng)頁(yè)總結(jié)功能。
Agent 熱潮襲來(lái)之后,更多的 AI 瀏覽器開(kāi)始強(qiáng)調(diào)自主執(zhí)行任務(wù)的能力,諸如 The Browser Company 的 Dia 瀏覽器、Perplexity 的 Comet 瀏覽器以及 Opera Neoa 均屬此類。微軟在宣傳 Edge 中的 Copilot 模式時(shí),同樣強(qiáng)調(diào)它的主動(dòng)性。
科技公司們對(duì)于 AI 瀏覽器的熱衷不難理解,誕生 30 余年之后,瀏覽器仍然是人們?cè)谧烂娑擞|達(dá)互聯(lián)網(wǎng)的第一窗口——甚至它的核心交互模式都沒(méi)有發(fā)生太大變化,一路從網(wǎng)景、IE 演變到今天的 Chrome,就連 Chrome 也是 17 年前的產(chǎn)品了。
大模型的誕生重塑了人們獲取信息的方式,人們普遍相信瀏覽器也將會(huì)發(fā)生改變,無(wú)論是巨頭還是創(chuàng)業(yè)公司都試圖搶占這一市場(chǎng)。市場(chǎng)調(diào)研機(jī)構(gòu) Market.us 預(yù)測(cè),全球 AI 瀏覽器市場(chǎng)將從 2024 年的 45 億美元增長(zhǎng)至 2034 年的約 768 億,年復(fù)合增長(zhǎng)率達(dá) 32.8%。
Market.us 報(bào)告
但很難說(shuō)當(dāng)下的 AI 瀏覽器與 AI Agent 之間的區(qū)隔有多么清晰——二者的底層技術(shù)類似、瞄準(zhǔn)的方向也是一樣的。微軟在 Copilot 模式中展現(xiàn)的能力,都可以在 OpenAI 過(guò)去半年的功能更新中找到影子。比如 OpenAI 年初更新的 Operator 功能,它讓 AI 操作網(wǎng)頁(yè)成為可能。微軟在宣傳片中描繪的 Copilot 未來(lái)能力,也和 OpenAI 的 ChatGPT Agent 十分類似。
蝴蝶效應(yīng)在推出 Manus 之前瞄準(zhǔn)的就是 AI 瀏覽器方向,但他們最終放棄了。Manus 聯(lián)合創(chuàng)始人張濤說(shuō),AI 瀏覽器的用戶體驗(yàn)受限,他們意識(shí)到要實(shí)現(xiàn)真正的通用的人工智能代理,必須要從瀏覽器界面脫離。
甚至 Perplexity 決定推出 AI 瀏覽器也像是被迫的,Perplexity CEO Aravind Srinivas 說(shuō),他曾經(jīng)聯(lián)系 Chrome 團(tuán)隊(duì),希望將 Perplexity 作為 Chrome 的默認(rèn)搜索引擎,但被拒絕,于是決定自己做一個(gè)。
——天知道 Srinivas 怎么想的。紐約時(shí)報(bào)稱,Google 為了成為 Safari 的默認(rèn)搜索引擎,僅 2021 年就向蘋(píng)果支付了約 180 億美元,怎么可能會(huì)將自家 Chrome 讓給競(jìng)爭(zhēng)對(duì)手。
Srinivas 對(duì)于 AI 瀏覽器的看法也和 AI Agent 有些類似。他今年 4 月的一次播客對(duì)談中說(shuō),瀏覽器就是構(gòu)建 Agent 的最佳方式。“瀏覽器本質(zhì)上就像一個(gè)容器化的操作系統(tǒng)。它可以在你已登錄第三方服務(wù)的情況下,通過(guò)隱藏標(biāo)簽頁(yè)訪問(wèn)這些服務(wù),在客戶端抓取頁(yè)面內(nèi)容,并代表你進(jìn)行推理和執(zhí)行操作。”
換句話說(shuō),AI 瀏覽器其實(shí)也是一種 AI Agent。只是由于當(dāng)前大模型能力受限,仍無(wú)法擺脫原有的瀏覽器框架,只能繼續(xù)以傳統(tǒng)標(biāo)簽頁(yè)和網(wǎng)頁(yè)交互為核心,更多只是對(duì)現(xiàn)有瀏覽器體驗(yàn)的增強(qiáng),而非徹底顛覆。
很難說(shuō)這樣的中間形態(tài)會(huì)吸引多少用戶改變習(xí)慣。微軟早在 2023 年就開(kāi)始為 Edge 瀏覽器加入 AI 功能,但兩年下來(lái)基本沒(méi)對(duì) Chrome 造成太大威脅,AI 的帶動(dòng)作用可能還沒(méi)有 Chromium 內(nèi)核大。
豌豆莢創(chuàng)始人王俊煜發(fā)表在《第一財(cái)經(jīng)》雜志的評(píng)論文章稱,今天的AI 瀏覽器雖然努力做了很多體驗(yàn)創(chuàng)新,但還遠(yuǎn)遠(yuǎn)不夠形成質(zhì)變。AI 還沒(méi)有深度融合到瀏覽器中,沒(méi)有真正成為“眼睛和手腳”。
Chrome 瀏覽器的市場(chǎng)壟斷地位也很難輕易撼動(dòng),多數(shù)標(biāo)榜 AI 的瀏覽器仍然在使用 Chromium 內(nèi)核。OpenAI 雖然被傳即將推出 AI 瀏覽器,但他們同時(shí)也對(duì)收購(gòu) Chrome 興趣頗大。
“即使 Dia 能從其中找到帶來(lái) 10 倍體驗(yàn)的亮點(diǎn),我也看不到什么 Chrome 無(wú)法跟進(jìn)的理由。”王俊煜說(shuō)。5 月,Google 在 Chrome 中增加了 Gemini 入口,可以閱讀網(wǎng)頁(yè)和對(duì)話,體驗(yàn)與 Dia 相似。
AI 瀏覽器往往強(qiáng)調(diào)可以自主操作網(wǎng)頁(yè),但又帶來(lái)了隱私安全問(wèn)題,并不是所有用戶都愿意將自己瀏覽的網(wǎng)頁(yè)發(fā)給 AI。
此前微軟在 Windows 中內(nèi)測(cè) Recall 功能,這是一個(gè)內(nèi)嵌在系統(tǒng)層級(jí)的 AI 工具,可以在后臺(tái)定期截取用戶屏幕和內(nèi)容,以方便用戶隨時(shí)切換至此前時(shí)間點(diǎn)。Recall 一經(jīng)推出就遭遇不少批評(píng),部分媒體報(bào)道甚至將其形容為監(jiān)控軟件。
科技媒體 The Verge 報(bào)道了微軟在 Edge 瀏覽器中推出 Copilot 模式的消息。文章下的高贊評(píng)論寫(xiě)道:“微軟在 Edge 的最新更新中捆綁了垃圾軟件 Copilot。”
另一條更活潑的評(píng)論說(shuō),“微軟需要決定一下,我到底該在瀏覽器里使用 Copilot,還是在 Windows 11 里使用?抑或是在 Word 文檔的每一行,甚至 Excel 的每一個(gè)單元格用?把那個(gè)該死的 Copilot 標(biāo)志塞滿每個(gè)角落,實(shí)在讓人心煩。
©山上版權(quán)所有,未經(jīng)授權(quán),禁止轉(zhuǎn)載
原文標(biāo)題 : 微軟進(jìn)軍 AI 瀏覽器,維持巨頭的平庸

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025 具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
8月14日立即報(bào)名>> 【在線研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬(wàn)億美元的公司
- 2 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車出海美國(guó)
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 5 具身智能泡沫爭(zhēng)議下,華映資本尋找「穿越周期者」
- 6 中國(guó)平安們欲靠AI守“陣地”
- 7 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 8 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 9 借仿生手實(shí)現(xiàn)突圍,國(guó)產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來(lái)新一輪協(xié)同進(jìn)化