訂閱
糾錯
加入自媒體

巨頭蜂擁而至,商湯背水一戰(zhàn)

當全球科技巨頭競相押注具身智能這一AI新風口時,中國AI產(chǎn)業(yè)的標志性企業(yè)商湯科技也吹響了全面進軍的號角。

這家曾以計算機視覺技術(shù)聞名、位列"AI四小龍"之首的科技企業(yè),在經(jīng)歷大模型時代的轉(zhuǎn)型陣痛后,正試圖通過"大模型+機器人"的戰(zhàn)略組合實現(xiàn)絕地反擊。

圖片

圖源來自pixabay圖庫

從密集的資本運作到頂尖人才集結(jié),從技術(shù)路線重構(gòu)到生態(tài)聯(lián)盟搭建,商湯的具身智能布局已遠不止于簡單的業(yè)務(wù)拓展,而是一場關(guān)乎生死的轉(zhuǎn)型之戰(zhàn)。

風口上的戰(zhàn)略轉(zhuǎn)身,商湯為何All in具身智能?

日漸擁擠的具身智能賽道,前有螞蟻集團直接成立子公司“螞蟻靈波科技”,后有美團密集領(lǐng)投它石智航、星海圖,京東連續(xù)投資千尋智能、眾擎機器人等企業(yè)。

海外戰(zhàn)場同樣硝煙彌漫,谷歌RT-2模型、Figure AI的Helix系統(tǒng)、英偉達的世界模型,均在爭奪物理世界交互的制高點。

作為中國AI產(chǎn)業(yè)曾經(jīng)的標桿企業(yè),商湯與曠視、云從、依圖并稱為"AI四小龍",憑借領(lǐng)先的計算機視覺技術(shù)在安防、智慧城市等領(lǐng)域風光無限,2021年登陸港股后,首日市值一度突破1500億港元。

然而進入大模型時代后,這批以視覺技術(shù)見長的AI企業(yè)集體開始遭遇發(fā)展瓶頸。商湯2024年財報顯示,公司全年實現(xiàn)營收37.72億元,凈虧損卻高達43.07億元,虧損額甚至超過營收總額。

同樣慘淡的還有云從科技,其2024年營收同比下滑36.7%,凈虧損擴大至6.96億元;而曠視和依圖則面臨業(yè)務(wù)收縮,后者甚至關(guān)閉了多個城市的辦事處,醫(yī)療板塊幾近停擺。

尤其在大模型浪潮下,OpenAI、月之暗面、深度求索等公司憑借語言大模型迅速崛起,而"四小龍"的技術(shù)主線仍集中在計算機視覺領(lǐng)域,核心收入依賴安防、交通等政府項目,占比普遍超過70%。

可見,商湯此次戰(zhàn)略轉(zhuǎn)型的背景實則是迫于生存壓力的背水一戰(zhàn)。

從另一角度來看,商湯的入局,也是一場蓄謀已久的“基因延伸”。據(jù)悉,其核心團隊已初步組建完畢,部分來自其原有的智能駕駛業(yè)務(wù),另一些則是計算機視覺專家和機器人領(lǐng)域資深從業(yè)者。

而這種人才流動也揭示了行業(yè)共性。自動駕駛與具身智能在環(huán)境感知、實時建模等底層技術(shù)上高度相通。畢竟“車就是四個輪子的機器人”,而智能駕駛的算法、仿真平臺在一定程度上,也可以直接遷移至機器人開發(fā)。

而且,具身智能(Embodied AI)被視為AI技術(shù)“落地化”的關(guān)鍵突破口,其核心在于通過機器人等物理實體實現(xiàn)"感知-理解-決策-執(zhí)行"的閉環(huán)交互。

這一概念在2025年政府工作報告中作為未來產(chǎn)業(yè)被首次提及,隨即引發(fā)資本熱潮,僅上半年國內(nèi)該領(lǐng)域融資就超過200億元,涉及130起融資事件,遠超2024年全年總和。

行業(yè)普遍預(yù)測,按照馬斯克提出的愿景,未來人形機器人將成為工業(yè)主力,數(shù)量有望超越人類,預(yù)計達到100億臺至200億臺,形成“不亞于手機的新終端市場”。

商湯選擇此時入局,正是希望借助“大模型+機器人”的復(fù)合路徑,將自身在視覺識別、多模態(tài)感知和大模型訓(xùn)練方面的積累轉(zhuǎn)化為新的增長引擎。

躬身入局的商湯,有自己的“具身智能”方程式

從“看懂世界”的視覺識別,到“思考世界”的多模態(tài)大模型,再到即將實現(xiàn)的“動手改造世界”的具身智能系統(tǒng)。商湯科技進軍具身智能絕非一時興起,而是基于其技術(shù)積累的漸進式躍遷。

商湯聯(lián)合創(chuàng)始人王曉剛帶領(lǐng)的團隊在智能駕駛領(lǐng)域研發(fā)的"絕影開悟"系統(tǒng),已經(jīng)能夠理解物理規(guī)律和學(xué)習交通規(guī)則,而汽車與機器人在本質(zhì)上都是具身智能體,這為技術(shù)遷移提供了可能。

不僅如此,商湯在技術(shù)路線上采取了分階段演進的務(wù)實策略。2022年8月,商湯推出家用下棋機器人"元蘿卜",首個家庭消費級人工智能產(chǎn)品,并將視覺算法與機械手深度結(jié)合,實現(xiàn)了棋子識別與遮擋環(huán)境下的精準抓取,初步構(gòu)建了"視覺-感知-決策"的閉環(huán)框架。

這一產(chǎn)品雖然功能單一,卻標志著商湯開始嘗試突破傳統(tǒng)AI的"開環(huán)"局限——從坐在云端"思考"世界,到真正與物理世界互動。

2025年4月,商湯發(fā)布"日日新SenseNova V6"多模態(tài)大模型,采用混合專家架構(gòu)(MoE),擁有6000億參數(shù),實現(xiàn)了"長思維鏈×數(shù)理能力×推理能力×全局記憶"的綜合提升,特別強化了多模態(tài)深度推理能力。

而且,該模型被接入人形機器人"飛燕"接入使用,使其具備全景視界感知、情感交互及心理健康篩查功能,同時還可以進行更自然的思考與表達。

不僅如此,商湯即將發(fā)布的具身智能"大腦"平臺,代表著其技術(shù)整合的新高度。從目前披露的信息看,該平臺旨在集成先進的感知、視覺導(dǎo)航及多模態(tài)交互能力,為機器人和各類智能終端提供強大賦能。

值得注意的是,商湯的轉(zhuǎn)型布局呈現(xiàn)出鮮明的"三位一體"特征。在資本層面,通過配售新股和分拆業(yè)務(wù)雙向融資;在技術(shù)層面,依托大裝置算力平臺和日日新大模型構(gòu)建基礎(chǔ)能力;在生態(tài)層面,則通過戰(zhàn)略合作與投資并購快速建立產(chǎn)業(yè)聯(lián)盟。

這種全方位推進的策略既反映了商湯轉(zhuǎn)型的決心,也暗示了其面臨的時間壓力與競爭態(tài)勢。如今,具身智能賽道已經(jīng)進入第二個發(fā)展階段,各個巨頭紛紛入場。商湯必須抓住這一波機器人浪潮的紅利,否則可能錯失逆風翻盤的機會。

巨頭云集的具身智能,商湯勝算幾何?

目前來看,具身智能賽道雖然前景廣闊,但已然成為科技巨頭與創(chuàng)業(yè)公司同場競技的殘酷紅海。商湯的入局面臨著來自國內(nèi)外多維度競爭者的挑戰(zhàn),這些對手在技術(shù)路線、資本實力和生態(tài)構(gòu)建方面各有所長。

全球范圍內(nèi),OpenAI與機器人公司Figure AI合作開發(fā)通用機器人,谷歌推出具身智能RT-2模型,英偉達則聚焦世界模型和仿真技術(shù)。

國內(nèi)市場中,華為于2025年6月發(fā)布包含“大腦”的CloudRobo具身智能平臺;字節(jié)跳動Seed團隊在7月22日推出通用機器人模型GR-3;智源研究院則更早發(fā)布了跨本體具身大小腦協(xié)作框架RoboOS與開源具身大腦RoboBrain。

圖片

宇樹科技UnitreeR1(圖源來自財聯(lián)社)

與此同時,互聯(lián)網(wǎng)巨頭也紛紛加碼。京東領(lǐng)投三家機器人企業(yè);美團連續(xù)主導(dǎo)了多個機器人相關(guān)的項目融資等等。

相較之下,商湯的核心優(yōu)勢在于計算機視覺領(lǐng)域的多年積累、多模態(tài)大模型的先發(fā)布局以及強大的算力基礎(chǔ)設(shè)施。視覺信息占人類感知的80%以上,而商湯始終活躍在機器視覺技術(shù)前沿,在圖像識別、視頻分析和環(huán)境理解方面具有深厚技術(shù)儲備。

此外,商湯"日日新"大模型系列在多模態(tài)融合方面國內(nèi)領(lǐng)先,V6版本已實現(xiàn)最長64K思維鏈、10分鐘長視頻理解及深度推理等能力,這為具身智能的認知決策提供了堅實基礎(chǔ)。

而且,23,000PetaFlops的算力規(guī)模則使商湯能夠支持大規(guī)模仿真訓(xùn)練和復(fù)雜模型迭代,這一基礎(chǔ)設(shè)施優(yōu)勢在短期內(nèi)難以被超越。

劣勢則在于硬件經(jīng)驗缺乏、現(xiàn)金流壓力和虧損困局。與特斯拉、華為等擁有成熟硬件供應(yīng)鏈的企業(yè)相比,商湯在機器人本體設(shè)計、運動控制和硬件集成方面幾乎從零開始。

雖然通過與傅利葉、松應(yīng)等企業(yè)合作可以部分彌補這一短板,但核心硬件能力的培育仍需要長期投入。在具身智能這一需要長期投入的領(lǐng)域,如何平衡研發(fā)投入與盈利預(yù)期將成為商湯的重大考驗。

而技術(shù)路線的不確定性也是商湯不得不面對的壓力。當前具身智能領(lǐng)域尚未形成統(tǒng)一的技術(shù)標準,VLA模型、"大小腦"架構(gòu)和世界模型三種路線并行發(fā)展,各有優(yōu)劣。

此外,具身智能的Scaling Law(規(guī)模法則)與語言模型有所不同,隨著參數(shù)增加和數(shù)據(jù)量擴大,系統(tǒng)性能提升的邊際成本可能更高。商湯需要精準把握技術(shù)演進方向,避免資源錯配。

結(jié)語

商湯的具身智能布局,本質(zhì)是將其計算機視覺霸權(quán)從“看懂世界”向“改造世界”的終極躍遷。

面對AI四小龍的集體困境——大模型時代的技術(shù)脫節(jié)、政府項目依賴,商湯選擇以“大模型+機器人”組合發(fā)起生死突圍。而此役成敗,不僅關(guān)乎企業(yè)存亡,更將重塑中國在全球具身智能競賽中的位勢。

作者:土耳其熱氣球

來源:港股研究社

       原文標題 : 巨頭蜂擁而至,商湯背水一戰(zhàn)

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號