2025年，具身智能終于來到爆發(fā)前夜

2025-08-12 17:34

文｜劉俊宏

編｜王一粟

“新老”機器人之間的悲歡并不相通。

當新一代機器人用人形機器人搏擊、遛狗的時候，傳統(tǒng)機器人公司還在用機械臂搬運貨物。一個是人聲鼎沸，一個是冷冷清清。

8月9日，又是一屆世界機器人大會（WRC）在北京開幕。作為歷屆最大的一次展會，本次展覽有200多家國內(nèi)外機器人企業(yè)出席，人形機器人整機企業(yè)有50多家。本次展會上共計展出1500多件展品、100多款首發(fā)新品，多的一面墻都“簡介”不完。

“大模型解決了機器人操作的問題，現(xiàn)在機器人能夠干活，能真正與物理世界交互了。”

對于機器人這一年間的進化，智澄AI創(chuàng)始人、CEO胡魯輝向光錐智能如此總結(jié)說。

冒著北京當天的大雨和水泄不通的人群，光錐智能在現(xiàn)場有三個最直觀的感受。

首先，今年人形機器人是大會的絕對主角。之前大會的A館一般著重展示機器人工業(yè)場景應(yīng)用。今年主辦方特意將宇樹和加速進化兩家人形機器人廠商安排進來“吸引流量”。用于演示新技術(shù)的B館，直接被人形機器人占領(lǐng)。會場沒有人形機器人的展臺，觀眾密度肉眼可見的“稀疏”。

其次，今年的人形機器人演示主打“可交互”。去年機器人展會上，不少機器人周圍還“拉著隔離帶”，今年機器人廠商希望消費者上手“摸一摸”。在小人形機器人、機器狗、機器人小玩具的展區(qū)，光錐智能看到不少消費者詢價，想要當場下單帶走。

最后，今年大多數(shù)機器人廠商的演示著重展現(xiàn)實用價值。機器人已經(jīng)實現(xiàn)了在工廠、科研教育、醫(yī)療養(yǎng)老等場景中的初步探索。

最接地氣的是街頭擺攤場景。大會現(xiàn)場隨處可見各種機器人現(xiàn)制咖啡小攤，還有機器人小酒吧、機器人煎餅果子、機器人零售小店等變種場景。

在工業(yè)場景上，率先落地的機器人廠商已經(jīng)開始強調(diào)集群協(xié)作的概念。相比去年單薄的“能干活”標簽，今年的機器人開始更多強調(diào)機器人與自動化產(chǎn)線結(jié)合、電池續(xù)航、連續(xù)工作時長、回報周期等更落地的數(shù)據(jù)指標。

實際的落地應(yīng)用，讓機器人開始進入到量產(chǎn)階段。當光錐智能詢問量產(chǎn)情況時，不少機器人廠商都自豪表示今年有上百臺的出貨量。機器人已經(jīng)開始滲透到我們的日常生活。

“今年會跟線上門店的商家合作落地100家。消費者線上下單之后，機器人負責分揀商品再交給騎手配送”。銀河通用機器人合伙人傅強向光錐智能介紹稱。

在大會現(xiàn)場，光錐智能還注意到三星的高管和幾家日企的高管在現(xiàn)場到處“觀察”。這意味著，中國的人形機器人將和其他機器人一樣有出海的機遇。

機器人行業(yè)的變化，是一個明顯的信號。

在一個技術(shù)創(chuàng)新驅(qū)動的行業(yè)，越是臨近大規(guī)模應(yīng)用，技術(shù)和產(chǎn)品的迭代速度就會越快。這是基于前期的積累，也是消費者共識驅(qū)動巴斯模型（創(chuàng)新擴散理論）收束的結(jié)果。

本次探展，光錐智能也聯(lián)系到了銀河通用、優(yōu)必選、智澄AI、眾擎機器人、魔法原子等多家重點公司的高管，一起全面探討了機器人行業(yè)的當下和未來。

2025年的機器人，主打一個能干活

“去年很多機器人都動不了，今年動起來了，可以做一些具體任務(wù)。”

在今年世界機器人大會現(xiàn)場，傅強向光錐智能總結(jié)著一年間的變化。走過一家家公司展位，光錐智能注意到今年機器人的“花架子”演示少了，與實際商業(yè)場景結(jié)合的演示多了。

現(xiàn)場機器人演示場景，大概能分為四類，每一類都緊緊圍繞著商業(yè)化的主題。

最吸引觀眾眼球的，是演示機器人的動作能力。

對比往年“小規(guī)模+定時定點”的機器人演示，今年各家廠商的機器人基本上都不帶停的。動作技術(shù)高一些的玩家都在“整活”，宇樹表演機器人格斗，加速進化表演機器人踢球，眾擎和魔法原子搞機器人走秀。圍觀人群里三層外三層，根本擠不進去。還有的廠商把機器人干脆“架”到了跑步機上。

大會上也有一些運動相對能力較弱的玩家。這些機器人的展示模式跟去年差不多，都是簡單展示一下外觀和對話能力。更弱一點的，則是給機器人穿了身衣服。內(nèi)部身體做成什么樣子，這就不得而知了。

有機器人動作演示的展臺，就有觀眾的圍觀。而圍觀本身，就能產(chǎn)生商業(yè)價值。“一臺機器人售價在小幾十萬，目前客戶有紅旗汽車，他們做展示接待用。”在樂聚機器人展臺，工作人員向光錐智能解釋著機器人演示所能帶來的商業(yè)價值。

而機器人現(xiàn)階段落地最好的，是隨處可見的零售機器人。

出現(xiàn)頻次最多的是賣咖啡和貨架場景機器人，兩種機器人已經(jīng)能完全實現(xiàn)自動化經(jīng)營能力。在賣咖啡的演示中，客戶掃碼下單，機器人自動完成出餐。這跟在線下咖啡店購買咖啡沒有任何區(qū)別。貨架零售場景，機器人根據(jù)觀眾的選擇，現(xiàn)場分揀拿貨。

此外，現(xiàn)場還有做煎餅果子、自動調(diào)酒等的零售場景，這些基本可以認為是“賣咖啡”的變種，都能提供客戶從掃碼到出餐的全流程任務(wù)。

值得注意的是，今年零售場景的機器人開始注重實際商業(yè)落地的細節(jié)。

例如煎餅果子機器人會顯示煎餅的所有狀態(tài)，讓消費者買得放心。另外，零售貨架機器人沒有盲目采用雙足運動方案，這樣設(shè)計主要是保證工作穩(wěn)定并兼顧續(xù)航。

傅強告訴光錐智能，“輪式的好處是技術(shù)相對成熟。一臺機器人搭載1.5度電的電池，就能支持連續(xù)工作8個小時。”

與零售場景相對的是，人形機器人在工業(yè)場景的應(yīng)用。

相比去年的單一機器人執(zhí)行固定任務(wù)的演示，今年機器人開始強調(diào)“集群協(xié)作”概念。今年大會現(xiàn)場上，雖然機器人工作內(nèi)容還是之前的分揀、搬運、質(zhì)檢“三件套”，但工作流程有了相互配合的概念。

“工業(yè)場景一定要走向集群作業(yè)的，單一場景落地一兩臺機器人沒什么意義。”

優(yōu)必選副總裁、研究院院長焦繼超告訴光錐智能，機器人集群協(xié)作代表人形機器人開始融入到現(xiàn)代工業(yè)生產(chǎn)體系。在這個過程中，機器人公司也能將應(yīng)用中遇到的難題，轉(zhuǎn)化成技術(shù)壁壘。“實現(xiàn)集群協(xié)作，需要機器人公司花時間深入客戶生產(chǎn)流程，跟客戶溝通，與客戶工業(yè)后臺管理系統(tǒng)進行對接。沒有實際落地前，這些配合是很難想象的。” 焦繼超說。

最后一類，則是行業(yè)再次上演的拼價格環(huán)節(jié)。

去年有些展商還對價格“諱莫如深”，今年都自信了許多。雖然買一個零售或工業(yè)用途的人形機器人依然成本高昂。但大多數(shù)展臺的工作人員都會明確告訴我們，售價具體是幾十萬還是接近百萬。整體來看，今年機器人的售價合理了不少。以導(dǎo)覽和演出類型的機器人為例，7-8萬的成本，跟一個人一年工資差不多。

另一邊，人形機器人又開始了價格戰(zhàn)。去年眾擎就扮演著“價格屠夫”的角色，今年推出的新品選擇“加量不加價”。去年3.85萬能買到一款只有“下半身”的產(chǎn)品，今年的新品是一個完整的人形姿態(tài)。

“價格再砍一刀”的秘訣，眾擎機器人聯(lián)合創(chuàng)始人任國穩(wěn)告訴光錐智能， “公司具備全棧自研能力，才能兼顧性能和售價”。

2025年，機器人真正“能干活、能掙錢”了。從今年濃厚的商業(yè)化氛圍中，我們能夠清晰地感受到，機器人行業(yè)在一年之間“變天了”。

一年了，大模型+機器人終于落地

為何人形機器人能在一年之間，從演示進階到實用？

“主要是大模型能力的提升。這一代機器人技術(shù)跟上一代最大的區(qū)別，就是‘腦子進化’了。”傅強稱。

這也是眾多機器人廠商的共識。

其中關(guān)鍵的VLA模型，可以理解成是用L（語言）對之前傳統(tǒng)的VA模型加了一層對現(xiàn)實世界可泛化、可預(yù)測的解釋。

“VLA的泛化能力可以通過視覺輸入直接輸出一個模型實時生成的動作，這就是與之前編程技術(shù)最大的區(qū)別”。傅強總結(jié)說。

例如智元的GO-1大模型可以看作是添加了一層CoT（思維鏈），這跟Figure、星海圖等主打“快慢雙系統(tǒng)”的公司核心設(shè)計架構(gòu)差不多。也有公司認為VLA之上還有世界大模型，胡魯輝告訴光錐智能，“VLA的scaling law已遇到瓶頸，世界模型是未來”。

我們能通過星海圖的家務(wù)機器人看到：屏幕左邊，是人類下達的“整理床鋪”指令。在屏幕右邊，是語言大模型實時拆解并生成的當前命令“回到初始位置”。

核心技術(shù)路線基本一致，使得各家廠商都選擇將機器人盡量都做成人形的樣子，哪怕這些演示和落地場景跟人形外觀“八竿子打不著”。

人形外觀具有兩個明確的AI訓(xùn)練優(yōu)勢。

其一是機器人訓(xùn)練的數(shù)據(jù)能隨著硬件升級，實現(xiàn)最大限度的復(fù)用。“一些公司現(xiàn)在還做不到雙足，給機器人設(shè)計人形的身體，是為了支持后續(xù)的泛化訓(xùn)練”，魔法原子銷售總監(jiān)田罡向光錐智能解釋稱。

另一層優(yōu)勢，是統(tǒng)一的大模型能顯著降低機器人廠商的技術(shù)開發(fā)周期。在眾擎展臺，一位工作人員向光錐智能透露稱，美的近期演示的美羅機器人下半身是基于眾擎SA01研發(fā)。不到一年時間，傳統(tǒng)制造業(yè)出身的美的，就完全掌握了人形機器人的所有運動能力。大模型大腦加上可組合的身體配件，簡直是把機器人變成了“變形金剛”。

在大模型的訓(xùn)練下，今年機器人動作也變得更加絲滑。今年機器人雖然也有偶爾摔跤或者手沒拿穩(wěn)的失誤，但光錐智能注意到，這些機器人的動作已經(jīng)非常接近人類。以星辰智能為例，在分揀場景中，機器人手、眼、軀干的協(xié)同，簡直跟人類“用筷子夾花生”一模一樣。

而借助大模型的泛化能力，VLA技術(shù)領(lǐng)先的廠商的機器人更能理解真實世界。

以貨架零售場景為例，機器人能抓的商品種類越多，代表著機器人“大腦”的泛化性更好。京東的場景全都是飲料，機器人抓取的物品類型非常單一。靈境啟元的貨架多了筒裝薯片、瓜子和紙盒包裝的商品，這些商品外包都屬于比較硬的一類。銀河通用的貨架就復(fù)雜多了，多了充氣包裝的薯片、小面包、方便面、花生、餅干、辣條、啤酒，整體商品復(fù)雜度跟大型超市的零食區(qū)相當。

“我們用仿真的方法造了百億級的訓(xùn)練數(shù)據(jù)。不管放什么樣的東西，都可以識別出來。”

誠如傅強的解釋，基于大量數(shù)據(jù)積累疊加VLA大模型訓(xùn)練，銀河通用機器人才實現(xiàn)了更強的泛化理解能力。

不過，也有機器人廠商認為應(yīng)該客觀理解VLA技術(shù)的上限。

焦繼超告訴光錐智能，訓(xùn)練機器人智能應(yīng)該更重視真實場景的數(shù)據(jù)。“VLA可能更適合驗證探索階段。很多廠商用仿真生成數(shù)據(jù)來訓(xùn)練VLA，這些數(shù)據(jù)缺少真實情境的隨機性。”

但無論如何，在大模型對機器人落地的催化下，今年所有機器人廠商都達成了重視軟件的共識。

任國穩(wěn)向光錐智能坦言道，“剛開始的時候，我們（眾擎）相對更重視硬件和運動控制上。但現(xiàn)在我們已經(jīng)投入更多精力在具身能力上。目前在研發(fā)投入上，軟件算法是顯著超過了硬件的。”

“關(guān)鍵還是技術(shù)突破，這樣才能做出真正有商業(yè)化能力的機器人”。正如胡魯輝所說，機器人行業(yè)已經(jīng)走到了大規(guī)模商業(yè)化的前夜。

商業(yè)化的前夜，快到洗牌時刻？

“資本現(xiàn)在很冷靜了，很快就迎來洗牌階段。不能快速落地的廠商，很可能要出問題。”

談到人形機器人的商業(yè)化競爭，焦繼超向行業(yè)劈頭蓋臉潑了一盆冷水。

另一邊，傅強認為領(lǐng)先商業(yè)化的機器人公司會率先建立足夠高的壁壘，進而達成“贏者通吃”的局面。“肯定是恒強者恒強，后發(fā)的玩家可能會失去機會。”傅強說。

優(yōu)必選和銀河通用，已經(jīng)將商業(yè)化看作機器人公司生死存亡的關(guān)鍵，而不是唯技術(shù)論。

在本次會展上，光錐智能感受到不同商業(yè)化階段的公司之間存在比較明顯的差異。

例如在工業(yè)場景，有些機器人廠商會強調(diào)機器人連續(xù)工作時長、充電還是換電、與真人員工的效益差距等指標。而另一些公司講的還是負重、自由度、動作協(xié)同等比較基礎(chǔ)的指標。后者的指標，或許并不是對于工業(yè)用戶最關(guān)心的。

焦繼超告訴光錐智能，工業(yè)場景客戶的訴求都很直接，“客戶上來先問能不能干活，第二個問題就是續(xù)航多少。”

對于機器人公司來說，落地應(yīng)用也能帶來真正意義上的產(chǎn)品迭代，很多硬件設(shè)計缺陷只有在工廠里面實際工作才能發(fā)現(xiàn)。例如優(yōu)必選Walker S2的迭代，有一條是讓機器人的手能直接摸到地面。這樣改動，是因為上一代機器人只能在固定高度搬箱子，而不能直接從地上搬。

在零售場景，商業(yè)化進展領(lǐng)先的機器人公司已經(jīng)“殺瘋了”。

“機器人已經(jīng)成標品了。一個機器人一天就能在線上門店里干活，甚至都不需要提前掃描商品。”誠如傅強所言，得益于超高的部署效率，銀河通用的零售機器人正在快速攻城略地。

零售場景機器人的落地如此順利，是因為這筆賬很好算。傅強說，O2O的商業(yè)邏輯要求必須24小時接單營業(yè)，維持這樣一個店鋪就需要2-3個人換班，機器人可以減少管理成本。以北京為例，一個員工到手七八千，對應(yīng)人員開支在1萬元左右。三個人一年30萬，兩年60萬。批量采購機器人，價格也就是在這個區(qū)間。

“最重要的是讓機器人解決問題，真正提高生產(chǎn)力。”胡魯輝總結(jié)說。

在大會最后，光錐智能還問了各家公司一個尖銳的問題——人形機器人大量應(yīng)用，是否會影響到普通打工人的就業(yè)機會？

焦繼超坦言稱，“其實是解決招工難的問題。”

事實上，傳統(tǒng)工業(yè)、服裝、3C電子這些行業(yè)都需要大量的人來完成組裝。但這些行業(yè)，普遍存在招工難和人員動不動就“提桶跑路”的問題。用工困難的現(xiàn)象，其實反映出人類并不喜歡這些枯燥且重復(fù)的工作。

為人類分憂，是機器人自誕生之初就被寄予的厚望。人形機器人的時代，已經(jīng)到了。

原文標題 : 2025年，具身智能終于來到爆發(fā)前夜