訂閱
糾錯
加入自媒體

2025年,具身智能終于來到爆發(fā)前夜

圖片

文|劉俊宏

編|王一粟

“新老”機器人之間的悲歡并不相通。

當新一代機器人用人形機器人搏擊、遛狗的時候,傳統(tǒng)機器人公司還在用機械臂搬運貨物。一個是人聲鼎沸,一個是冷冷清清。

8月9日,又是一屆世界機器人大會(WRC)在北京開幕。作為歷屆最大的一次展會,本次展覽有200多家國內(nèi)外機器人企業(yè)出席,人形機器人整機企業(yè)有50多家。本次展會上共計展出1500多件展品、100多款首發(fā)新品,多的一面墻都“簡介”不完。

圖片

“大模型解決了機器人操作的問題,現(xiàn)在機器人能夠干活,能真正與物理世界交互了。”

對于機器人這一年間的進化,智澄AI創(chuàng)始人、CEO胡魯輝向光錐智能如此總結(jié)說。

冒著北京當天的大雨和水泄不通的人群,光錐智能在現(xiàn)場有三個最直觀的感受。

首先,今年人形機器人是大會的絕對主角。之前大會的A館一般著重展示機器人工業(yè)場景應(yīng)用。今年主辦方特意將宇樹和加速進化兩家人形機器人廠商安排進來“吸引流量”。用于演示新技術(shù)的B館,直接被人形機器人占領(lǐng)。會場沒有人形機器人的展臺,觀眾密度肉眼可見的“稀疏”。

其次,今年的人形機器人演示主打“可交互”。去年機器人展會上,不少機器人周圍還“拉著隔離帶”,今年機器人廠商希望消費者上手“摸一摸”。在小人形機器人、機器狗、機器人小玩具的展區(qū),光錐智能看到不少消費者詢價,想要當場下單帶走。

最后,今年大多數(shù)機器人廠商的演示著重展現(xiàn)實用價值。機器人已經(jīng)實現(xiàn)了在工廠、科研教育、醫(yī)療養(yǎng)老等場景中的初步探索。

最接地氣的是街頭擺攤場景。大會現(xiàn)場隨處可見各種機器人現(xiàn)制咖啡小攤,還有機器人小酒吧、機器人煎餅果子、機器人零售小店等變種場景。

圖片

在工業(yè)場景上,率先落地的機器人廠商已經(jīng)開始強調(diào)集群協(xié)作的概念。相比去年單薄的“能干活”標簽,今年的機器人開始更多強調(diào)機器人與自動化產(chǎn)線結(jié)合、電池續(xù)航、連續(xù)工作時長、回報周期等更落地的數(shù)據(jù)指標。

圖片

實際的落地應(yīng)用,讓機器人開始進入到量產(chǎn)階段。當光錐智能詢問量產(chǎn)情況時,不少機器人廠商都自豪表示今年有上百臺的出貨量。機器人已經(jīng)開始滲透到我們的日常生活。

“今年會跟線上門店的商家合作落地100家。消費者線上下單之后,機器人負責分揀商品再交給騎手配送”。銀河通用機器人合伙人傅強向光錐智能介紹稱。

圖片

在大會現(xiàn)場,光錐智能還注意到三星的高管和幾家日企的高管在現(xiàn)場到處“觀察”。這意味著,中國的人形機器人將和其他機器人一樣有出海的機遇。

機器人行業(yè)的變化,是一個明顯的信號。

在一個技術(shù)創(chuàng)新驅(qū)動的行業(yè),越是臨近大規(guī)模應(yīng)用,技術(shù)和產(chǎn)品的迭代速度就會越快。這是基于前期的積累,也是消費者共識驅(qū)動巴斯模型(創(chuàng)新擴散理論)收束的結(jié)果。

本次探展,光錐智能也聯(lián)系到了銀河通用、優(yōu)必選、智澄AI、眾擎機器人、魔法原子等多家重點公司的高管,一起全面探討了機器人行業(yè)的當下和未來。

2025年的機器人,主打一個能干活

“去年很多機器人都動不了,今年動起來了,可以做一些具體任務(wù)。”

在今年世界機器人大會現(xiàn)場,傅強向光錐智能總結(jié)著一年間的變化。走過一家家公司展位,光錐智能注意到今年機器人的“花架子”演示少了,與實際商業(yè)場景結(jié)合的演示多了。

現(xiàn)場機器人演示場景,大概能分為四類,每一類都緊緊圍繞著商業(yè)化的主題。

最吸引觀眾眼球的,是演示機器人的動作能力。

對比往年“小規(guī)模+定時定點”的機器人演示,今年各家廠商的機器人基本上都不帶停的。動作技術(shù)高一些的玩家都在“整活”,宇樹表演機器人格斗,加速進化表演機器人踢球,眾擎和魔法原子搞機器人走秀。圍觀人群里三層外三層,根本擠不進去。還有的廠商把機器人干脆“架”到了跑步機上。

圖片

大會上也有一些運動相對能力較弱的玩家。這些機器人的展示模式跟去年差不多,都是簡單展示一下外觀和對話能力。更弱一點的,則是給機器人穿了身衣服。內(nèi)部身體做成什么樣子,這就不得而知了。

圖片

有機器人動作演示的展臺,就有觀眾的圍觀。而圍觀本身,就能產(chǎn)生商業(yè)價值。“一臺機器人售價在小幾十萬,目前客戶有紅旗汽車,他們做展示接待用。”在樂聚機器人展臺,工作人員向光錐智能解釋著機器人演示所能帶來的商業(yè)價值。

而機器人現(xiàn)階段落地最好的,是隨處可見的零售機器人。

出現(xiàn)頻次最多的是賣咖啡和貨架場景機器人,兩種機器人已經(jīng)能完全實現(xiàn)自動化經(jīng)營能力。在賣咖啡的演示中,客戶掃碼下單,機器人自動完成出餐。這跟在線下咖啡店購買咖啡沒有任何區(qū)別。貨架零售場景,機器人根據(jù)觀眾的選擇,現(xiàn)場分揀拿貨。

此外,現(xiàn)場還有做煎餅果子、自動調(diào)酒等的零售場景,這些基本可以認為是“賣咖啡”的變種,都能提供客戶從掃碼到出餐的全流程任務(wù)。

圖片

值得注意的是,今年零售場景的機器人開始注重實際商業(yè)落地的細節(jié)。

例如煎餅果子機器人會顯示煎餅的所有狀態(tài),讓消費者買得放心。另外,零售貨架機器人沒有盲目采用雙足運動方案,這樣設(shè)計主要是保證工作穩(wěn)定并兼顧續(xù)航。

傅強告訴光錐智能,“輪式的好處是技術(shù)相對成熟。一臺機器人搭載1.5度電的電池,就能支持連續(xù)工作8個小時。”

與零售場景相對的是,人形機器人在工業(yè)場景的應(yīng)用。

相比去年的單一機器人執(zhí)行固定任務(wù)的演示,今年機器人開始強調(diào)“集群協(xié)作”概念。今年大會現(xiàn)場上,雖然機器人工作內(nèi)容還是之前的分揀、搬運、質(zhì)檢“三件套”,但工作流程有了相互配合的概念。

圖片

“工業(yè)場景一定要走向集群作業(yè)的,單一場景落地一兩臺機器人沒什么意義。”

優(yōu)必選副總裁、研究院院長焦繼超告訴光錐智能,機器人集群協(xié)作代表人形機器人開始融入到現(xiàn)代工業(yè)生產(chǎn)體系。在這個過程中,機器人公司也能將應(yīng)用中遇到的難題,轉(zhuǎn)化成技術(shù)壁壘。“實現(xiàn)集群協(xié)作,需要機器人公司花時間深入客戶生產(chǎn)流程,跟客戶溝通,與客戶工業(yè)后臺管理系統(tǒng)進行對接。沒有實際落地前,這些配合是很難想象的。” 焦繼超說。

最后一類,則是行業(yè)再次上演的拼價格環(huán)節(jié)。

去年有些展商還對價格“諱莫如深”,今年都自信了許多。雖然買一個零售或工業(yè)用途的人形機器人依然成本高昂。但大多數(shù)展臺的工作人員都會明確告訴我們,售價具體是幾十萬還是接近百萬。整體來看,今年機器人的售價合理了不少。以導(dǎo)覽和演出類型的機器人為例,7-8萬的成本,跟一個人一年工資差不多。

另一邊,人形機器人又開始了價格戰(zhàn)。去年眾擎就扮演著“價格屠夫”的角色,今年推出的新品選擇“加量不加價”。去年3.85萬能買到一款只有“下半身”的產(chǎn)品,今年的新品是一個完整的人形姿態(tài)。

“價格再砍一刀”的秘訣,眾擎機器人聯(lián)合創(chuàng)始人任國穩(wěn)告訴光錐智能, “公司具備全棧自研能力,才能兼顧性能和售價”。

圖片

2025年,機器人真正“能干活、能掙錢”了。從今年濃厚的商業(yè)化氛圍中,我們能夠清晰地感受到,機器人行業(yè)在一年之間“變天了”。

一年了,大模型+機器人終于落地

為何人形機器人能在一年之間,從演示進階到實用?

“主要是大模型能力的提升。這一代機器人技術(shù)跟上一代最大的區(qū)別,就是‘腦子進化’了。”傅強稱。

這也是眾多機器人廠商的共識。

其中關(guān)鍵的VLA模型,可以理解成是用L(語言)對之前傳統(tǒng)的VA模型加了一層對現(xiàn)實世界可泛化、可預(yù)測的解釋。

“VLA的泛化能力可以通過視覺輸入直接輸出一個模型實時生成的動作,這就是與之前編程技術(shù)最大的區(qū)別”。傅強總結(jié)說。

例如智元的GO-1大模型可以看作是添加了一層CoT(思維鏈),這跟Figure、星海圖等主打“快慢雙系統(tǒng)”的公司核心設(shè)計架構(gòu)差不多。也有公司認為VLA之上還有世界大模型,胡魯輝告訴光錐智能,“VLA的scaling law已遇到瓶頸,世界模型是未來”。

我們能通過星海圖的家務(wù)機器人看到:屏幕左邊,是人類下達的“整理床鋪”指令。在屏幕右邊,是語言大模型實時拆解并生成的當前命令“回到初始位置”。

圖片

核心技術(shù)路線基本一致,使得各家廠商都選擇將機器人盡量都做成人形的樣子,哪怕這些演示和落地場景跟人形外觀“八竿子打不著”。

圖片

人形外觀具有兩個明確的AI訓(xùn)練優(yōu)勢。

其一是機器人訓(xùn)練的數(shù)據(jù)能隨著硬件升級,實現(xiàn)最大限度的復(fù)用。“一些公司現(xiàn)在還做不到雙足,給機器人設(shè)計人形的身體,是為了支持后續(xù)的泛化訓(xùn)練”,魔法原子銷售總監(jiān)田罡向光錐智能解釋稱。

圖片

另一層優(yōu)勢,是統(tǒng)一的大模型能顯著降低機器人廠商的技術(shù)開發(fā)周期。在眾擎展臺,一位工作人員向光錐智能透露稱,美的近期演示的美羅機器人下半身是基于眾擎SA01研發(fā)。不到一年時間,傳統(tǒng)制造業(yè)出身的美的,就完全掌握了人形機器人的所有運動能力。大模型大腦加上可組合的身體配件,簡直是把機器人變成了“變形金剛”。

圖片

在大模型的訓(xùn)練下,今年機器人動作也變得更加絲滑。今年機器人雖然也有偶爾摔跤或者手沒拿穩(wěn)的失誤,但光錐智能注意到,這些機器人的動作已經(jīng)非常接近人類。以星辰智能為例,在分揀場景中,機器人手、眼、軀干的協(xié)同,簡直跟人類“用筷子夾花生”一模一樣。

而借助大模型的泛化能力,VLA技術(shù)領(lǐng)先的廠商的機器人更能理解真實世界。

以貨架零售場景為例,機器人能抓的商品種類越多,代表著機器人“大腦”的泛化性更好。京東的場景全都是飲料,機器人抓取的物品類型非常單一。靈境啟元的貨架多了筒裝薯片、瓜子和紙盒包裝的商品,這些商品外包都屬于比較硬的一類。銀河通用的貨架就復(fù)雜多了,多了充氣包裝的薯片、小面包、方便面、花生、餅干、辣條、啤酒,整體商品復(fù)雜度跟大型超市的零食區(qū)相當。

圖片

“我們用仿真的方法造了百億級的訓(xùn)練數(shù)據(jù)。不管放什么樣的東西,都可以識別出來。”

誠如傅強的解釋,基于大量數(shù)據(jù)積累疊加VLA大模型訓(xùn)練,銀河通用機器人才實現(xiàn)了更強的泛化理解能力。

不過,也有機器人廠商認為應(yīng)該客觀理解VLA技術(shù)的上限。

焦繼超告訴光錐智能,訓(xùn)練機器人智能應(yīng)該更重視真實場景的數(shù)據(jù)。“VLA可能更適合驗證探索階段。很多廠商用仿真生成數(shù)據(jù)來訓(xùn)練VLA,這些數(shù)據(jù)缺少真實情境的隨機性。”

但無論如何,在大模型對機器人落地的催化下,今年所有機器人廠商都達成了重視軟件的共識。

任國穩(wěn)向光錐智能坦言道,“剛開始的時候,我們(眾擎)相對更重視硬件和運動控制上。但現(xiàn)在我們已經(jīng)投入更多精力在具身能力上。目前在研發(fā)投入上,軟件算法是顯著超過了硬件的。”

“關(guān)鍵還是技術(shù)突破,這樣才能做出真正有商業(yè)化能力的機器人”。正如胡魯輝所說,機器人行業(yè)已經(jīng)走到了大規(guī)模商業(yè)化的前夜。

商業(yè)化的前夜,快到洗牌時刻?

“資本現(xiàn)在很冷靜了,很快就迎來洗牌階段。不能快速落地的廠商,很可能要出問題。”

談到人形機器人的商業(yè)化競爭,焦繼超向行業(yè)劈頭蓋臉潑了一盆冷水。

另一邊,傅強認為領(lǐng)先商業(yè)化的機器人公司會率先建立足夠高的壁壘,進而達成“贏者通吃”的局面。“肯定是恒強者恒強,后發(fā)的玩家可能會失去機會。”傅強說。

優(yōu)必選和銀河通用,已經(jīng)將商業(yè)化看作機器人公司生死存亡的關(guān)鍵,而不是唯技術(shù)論。

在本次會展上,光錐智能感受到不同商業(yè)化階段的公司之間存在比較明顯的差異。

例如在工業(yè)場景,有些機器人廠商會強調(diào)機器人連續(xù)工作時長、充電還是換電、與真人員工的效益差距等指標。而另一些公司講的還是負重、自由度、動作協(xié)同等比較基礎(chǔ)的指標。后者的指標,或許并不是對于工業(yè)用戶最關(guān)心的。

圖片

焦繼超告訴光錐智能,工業(yè)場景客戶的訴求都很直接,“客戶上來先問能不能干活,第二個問題就是續(xù)航多少。”

對于機器人公司來說,落地應(yīng)用也能帶來真正意義上的產(chǎn)品迭代,很多硬件設(shè)計缺陷只有在工廠里面實際工作才能發(fā)現(xiàn)。例如優(yōu)必選Walker S2的迭代,有一條是讓機器人的手能直接摸到地面。這樣改動,是因為上一代機器人只能在固定高度搬箱子,而不能直接從地上搬。

在零售場景,商業(yè)化進展領(lǐng)先的機器人公司已經(jīng)“殺瘋了”。

“機器人已經(jīng)成標品了。一個機器人一天就能在線上門店里干活,甚至都不需要提前掃描商品。”誠如傅強所言,得益于超高的部署效率,銀河通用的零售機器人正在快速攻城略地。

零售場景機器人的落地如此順利,是因為這筆賬很好算。傅強說,O2O的商業(yè)邏輯要求必須24小時接單營業(yè),維持這樣一個店鋪就需要2-3個人換班,機器人可以減少管理成本。以北京為例,一個員工到手七八千,對應(yīng)人員開支在1萬元左右。三個人一年30萬,兩年60萬。批量采購機器人,價格也就是在這個區(qū)間。

“最重要的是讓機器人解決問題,真正提高生產(chǎn)力。”胡魯輝總結(jié)說。

在大會最后,光錐智能還問了各家公司一個尖銳的問題——人形機器人大量應(yīng)用,是否會影響到普通打工人的就業(yè)機會?

焦繼超坦言稱,“其實是解決招工難的問題。”

事實上,傳統(tǒng)工業(yè)、服裝、3C電子這些行業(yè)都需要大量的人來完成組裝。但這些行業(yè),普遍存在招工難和人員動不動就“提桶跑路”的問題。用工困難的現(xiàn)象,其實反映出人類并不喜歡這些枯燥且重復(fù)的工作。

為人類分憂,是機器人自誕生之初就被寄予的厚望。人形機器人的時代,已經(jīng)到了。

       原文標題 : 2025年,具身智能終于來到爆發(fā)前夜

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號