通義千問與文心一言對比評測:誰才是蘋果AI的“黃金搭檔”?
4499元起,iPhone 16e來了,該不該買卻要慎重考慮。
僅看硬件配置,同價位的安卓手機應該沒有比它更差的,但對于蘋果用戶而言,iPhone 16e是價格最低的AI iPhone,是預算有限又想體驗蘋果AI功能的消費者的最佳之選。
去年10月蘋果就表示,Apple Intelligence將于2025年4月初推出簡體中文版,F(xiàn)在iPhone 16e商品頁面又顯示Apple Intelligence推出時間將依監(jiān)管部門審批情況而定,表明該功能已完成開發(fā)并送審,大概率可以如此前的宣傳一般,在4月初與iOS 18.4一同上線。
(圖源:蘋果)
為確保Apple Intelligence符合國內相關要求,蘋果需要在中國尋找AI企業(yè)作為合作伙伴,方能為中國用戶提供AI功能。最初豆包、百度等AI公司傳出過與蘋果合作的消息,經過一番篩選后,蘋果被曝選擇了阿里巴巴作為合作伙伴,放棄了百度。2月13日,阿里巴巴聯(lián)合創(chuàng)始人蔡崇信在阿聯(lián)酋迪拜舉辦的World Governments Summit 2025峰會上,確認了與蘋果合作的消息。
然而據科技媒體The Information報道,蘋果并未放棄百度,同時與阿里巴巴和百度兩家企業(yè)合作,百度也會參與部分AI套件的研發(fā)工作,包括中文版Siri語音助手升級、圖片和文本智能搜索等。
百度、阿里巴巴、騰訊三家企業(yè)曾并列中國互聯(lián)網三巨頭,合稱“BAT”,進入AI時代后分別開發(fā)出了文心一言、通義千問、騰訊混元三大AI大模型。蘋果同時與百度和阿里巴巴合作,令小雷想到了當初蘋果讓供應商內卷的畫面,唯有實力強勁的供應商才能加入果鏈。那么問題來了,百度和阿里哪個才是蘋果AI領域的“黃金搭檔”?
阿里VS百度,誰才是蘋果AI的黃金搭檔?
在之前關于AI大模型的測試中,小雷曾多次對比過通義千問、文心一言、豆包、Kimi、DeepSeek等國產AI大模型,但當時文心4.0及更強的大模型收費服務,為公平起見,小雷選擇了免費的文心3.5大模型。
現(xiàn)在,百度已宣布文心一言將于4月1日起免費服務,6月30日起開源模型。在免費服務之前,每天還會發(fā)放VIP體驗券,幾乎等同于已經免費服務。因此,小雷決定用文心一言最強的文心4.0 Turbo對比通義千問屢獲殊榮的Qwen 2.5模型。
考慮到阿里巴巴、百度與蘋果合作是為了向iPhone用戶提供AI服務,小雷將此測試項目問題全部設為我們日常使用手機時,可能會遇到的問題或需要處理的事項。
常識問答:PC端通義千問才是完全體?
在針對AI的測試項目中,常識問答一般最為簡單,小雷本以為這場測試難以體現(xiàn)出AI大模型的差距,結果卻令小雷有點驚訝。
早有假期旅游計劃的小雷,向AI提出的第一道問題為“今年高速哪些時間免費”。通義千問并未將今年高速所有免費時間段全部告知小雷,僅給出了春節(jié)期間高速免費開始和結束時間。不死心的小雷問了兩次,得到的回答完全相同。文心一言則將春節(jié)、清明、勞動節(jié)、國慶節(jié)四個時間段,高速免費開始和結束時間全部統(tǒng)計出來,并備注了免費通用型車輛的標準。
(左:通義;右:文小言;圖源:App截圖)
需要注意的是,當小雷切換至PC端,再向通義千問詢問該問題,居然得到了正確答案?尚±椎谌问褂檬謾C端通義App詢問該問題,通義千問依然給出了與前兩次相同的錯誤答案。
(圖源:通義千問截圖)
從結果來看,通義千問在常識解答方面的能力不輸文心一言,只是自身網頁版和手機App似乎存在差距,手機端三次回答全部錯誤,PC端一次就回答正確。考慮到這層因素,接下來的幾輪測試,全部改用網頁版通義千問和文心一言。
工作提效:文心、通義各有所長
許多較長的論文、文檔小雷總是沒有時間從頭看到尾,好在AI大模型基本加入了內容總結功能。本輪測試小雷便選擇了此前清華大學新聞與傳播學院、新媒體研究中心、元宇宙文化實驗室聯(lián)合推出的《DeepSeek:從入門到精通》文件,讓通義千問和百度為我們分析、總結DeepSeek的使用技巧。
通義千問總結的內容分為六大板塊,前四個板塊均為分析DeepSeek的領先性和應用場景,第五板塊為清華大學的貢獻,最后一個板塊為未來展望,每一個板塊的內容都極為簡略,倒是可以作為DeepSeek入門前了解基礎知識的閱讀材料,跟“精通”二字完全無關。
(圖源:通義千問截圖)
文心一言總結出的內容分為12個小板塊,每個板塊同樣簡略,但并未忽視提示語的重要性和使用技巧板塊,忽略了對于用戶沒有意義的清華大學貢獻一欄。當然,文心一言總結的內容僅僅是略勝一籌,如果說通義千問總結的內容像大標題及簡單介紹,文心一言總結的內容則是小標題加內容梗概,實質性內容依然稀少。
(圖源:文心一言截圖)
車轱轆話亂轉,重點內容過于簡略,罕有實用性的內容,是當前AI大模型總結內容時普遍存在的問題。數(shù)萬字的文件,濃縮成數(shù)百字,難免需要舍棄大量內容,在使用AI總結篇幅較長的文檔時,最好還是自己按照生成的內容,再大致看一下原文檔。
為進一步測試兩款AI大模型的能力,小雷決定縮小范圍,讓大模型根據文件中提示語鏈相關的內容,撰寫一篇提示語鏈作用與設計原則的文章。
這輪測試中,通義千問一改之前簡略的風格,提示語鏈的作用、設計原則、設計模型三大板塊均面面俱到,教導用戶該如何設計和使用提示語鏈。
(圖源:通義千問截圖)
文心一言則延續(xù)了簡約的風格,作用機制的分析和設計原則的解讀給人一種未能準確理解文件的感覺。
(圖源:文心一言截圖)
本輪測試中,PDF全文解讀方面,文心一言表現(xiàn)稍好,提示語鏈專項內容生成方面,則是通義千問領先,二者互有優(yōu)勢。蘋果同時與阿里巴巴、百度合作,或許可以綜合二者的特點,為用戶提供更完善的AI體驗。
360開發(fā)的納米AI搜索App,便提供混合模型方案,聯(lián)合15家大模型廠商打造AI助手,能夠自動調整大模型回答問題。未來或許其他企業(yè)也會采取此類方案,通過混合模型解決單一模型不擅長部分領域的問題。
圖片修改:文心再勝一場
AI攝影、AI修圖在今天已是極為常見的功能,許多手機廠商還會在新機發(fā)布時宣傳AI修圖功能。小雷也對通義千問和文心一言的圖片修改功能進行了測試,但本輪測試出現(xiàn)了一點意外。
通義千問本身不支持以文字指令修改圖片,雖提供諸多可修改圖片的智能體,但這些智能體卻均不支持上傳圖片,無法正常使用,唯一可上傳圖片的修圖智能體是AI擴圖,又僅是等比例縮小或放大圖片,并非根據畫面已有內容,額外繪制不存在的內容。
(圖源:通義千問截圖)
文心一言倒是根據小雷的要求,成功將圖片的背景從灰蒙蒙的天空替換成藍天白云?蔁羲黧w卻重繪,不再是原來的燈塔,根據拍攝照片和要求重新繪制了一張圖,僅保留了主體的特征。
(圖源:文心一言截圖)
為進一步測試兩款AI大模型的制圖能力,小雷以“海邊矗立著一座孤獨的燈塔,唯有藍天白云和海鳥與其相伴”為描述語,要求通義千問和文心一言各生成一張圖。從圖片質量來看,文心一言生成的圖片意境、清晰度、美感等方面均更勝一籌,而且文心一言會一次生成四張圖片供用戶選擇。
(圖源:通義千問生成)
(圖源:文心一言生成)
本輪測試文心一言再次獲勝,既可以根據原圖重新繪制圖片,也能根據用戶的描述生成圖片,而且生成的圖片質量更高,原圖大小為1.48MB,通義千問生成的圖片原圖大小則僅為73.2KB(注明:兩張圖片原圖分辨率均為1024×1024)。
通義千問Qwen 2.5作為一款開源模型,追求的是便于用戶部署、使用、修改,更注重B端場景,對于C端用戶的需求似乎沒有那么上心。文心4.0 Turbo曾是閉源模型,面向C端用戶收費,因而需要豐富手機App和PC端的功能。本輪測試的落后,并不等同于通義千問Qwen 2.5落后文心4.0 Turbo。
左擁阿里右抱百度,蘋果智能上雙保險?
以上幾輪測試中,通義千問和文心一言均有自己的優(yōu)勢項目:百度在圖片生成和文檔總結方面表現(xiàn)較好,通義千問則在提取重點內容并撰寫文章方面更加出色。
因模型架構、訓練所用的數(shù)據存在差異,AI大模型之間自然也會出現(xiàn)優(yōu)勢領域不同的情況。蘋果同時與阿里巴巴、百度合作,可能有充分利用兩家企業(yè)的優(yōu)勢,實現(xiàn)揚長避短,在各種場景下均能為用戶提供行業(yè)第一梯隊的體驗的考慮。
(圖源:蘋果)
中文版Apple Intelligence與英文版在體驗方面很可能會存在較大差距,哪一個更領先還不好說,阿里巴巴加上百度的AI實力加持的Apple Intelligence,值得期待。
4499元起的iPhone 16e略貴,好在128GB/256GB版本定價低于6000元,可享受政府補貼,3999元/4999元即可入手,各大電商平臺大概率也會推出一定的優(yōu)惠方案。相較iPhone 16系列其他機型,擁有價格優(yōu)勢且支持Apple Intelligence,能否推動蘋果銷量翻盤?關鍵還要看蘋果在中國市場端出來的“AI大餐”的體驗。
手機AI進化一日千里,留給蘋果的時間不多了
在蘋果AI亦步亦趨時,安卓/鴻蒙陣營的手機品牌在AI上進展神速。
在海外市場,聯(lián)想(Moto)和三星靠著Google Gemini和運營商支持正“大殺四方”;在國內市場,小米、華為、OPPO、vivo、榮耀等品牌已完成各自AI化進程,AI功能可圈可點甚至讓人眼花繚亂,甚至成了手機廠商“卷”的新焦點。
25年春節(jié)后DeepSeek爆火,國產手機廠商(除了小米)大都第一時間接入了DeepSeek,這其實證明了安卓手機開放性的優(yōu)勢:以后DeepSeek新模型,或者比DeepSeek更強的AI模型出現(xiàn),安卓手機都可在第一時間接入,絕不掉隊。
然而iPhone就只能讓用戶等,因為蘋果封閉模式必須點對點合作,這會讓iPhone用戶的智能體驗有代差。其實在中國用戶等待蘋果智能這半年時,DeepSeek R1/V3,xAI Grok 3以及百度文心4.5(即將發(fā)布,開源且免費)就已紛紛發(fā)布,AI技術進步可謂是一日千里。姍姍來遲的蘋果智能真能打嗎?小雷很悲觀。
對中國用戶來說,“蘋果智能”依然是懸而未決的“餅”。從春節(jié)到現(xiàn)在,中國用戶正在習慣使用強大的DeepSeek以及接入DeepSeek的微信、百度以及國產安卓手機等產品的AI服務,對AI的期待正在變得越來越高。蘋果與阿里或者百度合作落地的“蘋果智能”能否滿足中國用戶預期,依然有待觀察。
來源:雷科技
原文標題 : 通義千問與文心一言對比評測:誰才是蘋果AI的“黃金搭檔”?

請輸入評論內容...
請輸入評論/評論長度6~500個字