這屆機(jī)器人火力全開(kāi),不止炫技更要落地
作者|白雪 毛心如
「這不是機(jī)器人的春天,這是機(jī)器人的夏天」。
這可能是世界機(jī)器人大會(huì)舉辦 10 年以來(lái)最熱鬧、最有門道的一屆。
一方面參展企業(yè)達(dá)到歷史高峰,200 余家國(guó)內(nèi)外機(jī)器人企業(yè)參展,1500 余件展品。
更最重要的是,這屆機(jī)器人動(dòng)起來(lái)了。
一位連續(xù)參加了 6 年大會(huì)的展會(huì)人員提到:「去年和今年變化很大,去年機(jī)器人都是被架起來(lái)的,今年都動(dòng)起來(lái)了!
世界機(jī)器人大會(huì)也是機(jī)器人產(chǎn)業(yè)鏈的眾生相。聚集機(jī)器人本體的 B 館人潮洶涌,一進(jìn)門眾擎、逐際動(dòng)力、傅利葉鎮(zhèn)場(chǎng),魔法原子、維他動(dòng)力、千尋智能、星海圖齊齊排開(kāi),但凡展位有拳擊比賽、跳舞表演,別想了,擠都擠不進(jìn)去。
A 館則聚集著宇樹(shù)、優(yōu)必選、智平方、越疆機(jī)器人等等明星機(jī)器人公司。
C 館主要聚集著為機(jī)器人行業(yè)提供軟硬件解決方案、核心零部件的供應(yīng)商,比如禾賽科技、速騰聚創(chuàng)、靈心巧手、靈巧智能、傲意科技等等。
熱鬧背后,機(jī)器人正在從遙操、編程走向自主思考,從炫技表演走向場(chǎng)景化落地應(yīng)用。但再往前走一步,食物鏈最頂端的人形機(jī)器人遠(yuǎn)未走到商業(yè)化落地,一臺(tái)開(kāi)發(fā)價(jià)格大幾百萬(wàn)的人形機(jī)器人,要么靠融資,要么靠著公司賣配送機(jī)器人的盈利養(yǎng)活工程師團(tuán)隊(duì)。
每一家企業(yè)都非常用力想要自己看起來(lái)更性感。
當(dāng)你看倦了機(jī)器人鏟爆米花的時(shí)候,就會(huì)冷不丁瞅見(jiàn)有家長(zhǎng)推著坐輪椅的孩子在了解下肢外骨骼機(jī)器人,這時(shí)候才會(huì)發(fā)現(xiàn),技術(shù)滾滾向前,它并沒(méi)有落下任何人。
有人說(shuō)這場(chǎng)大會(huì)沒(méi)有共識(shí),并非如此。算法與數(shù)據(jù)之爭(zhēng),真實(shí)與仿真數(shù)據(jù)之爭(zhēng),模型能力之爭(zhēng),機(jī)器人形態(tài)之爭(zhēng)。這些爭(zhēng)論恰好是構(gòu)成機(jī)器人大亂斗時(shí)代的基礎(chǔ)。
所有機(jī)器人公司所追求具身智能的先進(jìn)形態(tài)、瘋狂開(kāi)屏的樣子,恰恰是這場(chǎng)大會(huì)的絕妙之處。
這一次我們?cè)噲D從機(jī)器人大腦、芯片、本體、眼睛、手五大關(guān)鍵領(lǐng)域梳理行業(yè)初步共識(shí)。
機(jī)器人大腦:VLA 成萬(wàn)模之源,有思考能力才是完全進(jìn)化形態(tài)
通用機(jī)器人=通用大腦+通用本體,這是行業(yè)內(nèi)對(duì)于通用機(jī)器人基本的認(rèn)知。
在逛完 WRC 之后,所有廠家的通用大腦可以分為三種能力等級(jí):
初級(jí):機(jī)器人動(dòng)作主要依靠遙操和編程,比如機(jī)器人背后站著一位神秘的黑衣人,這就是人類操作員在操控機(jī)器人。
中級(jí):能在部分場(chǎng)景內(nèi)實(shí)現(xiàn)一定的自主思考能力,比如能夠在快遞場(chǎng)景自主分揀貨物等。
高級(jí):具備高度跨場(chǎng)景泛化能力,在大部分場(chǎng)景都具備自主思考能力,而目前具備此能力的產(chǎn)品還尚未出現(xiàn),主要是因?yàn)?VLA 模型仍然處于實(shí)驗(yàn)室階段。
高級(jí)別能力可以理解為機(jī)器人大腦的臨界點(diǎn)。王興興舉例,機(jī)器人的臨界點(diǎn)應(yīng)該是即便機(jī)器人來(lái)到陌生的會(huì)場(chǎng),只要跟它說(shuō)把這瓶水帶給觀眾,它就能完成獨(dú)立完成。
而要達(dá)到這一等級(jí)的自主思考能力,業(yè)內(nèi)主流方案是向 VLA 模型發(fā)展。這種模型可以將視覺(jué)感知、語(yǔ)言理解和物理動(dòng)作融為一體,讓機(jī)器人能夠聽(tīng)懂人的指令看懂當(dāng)前的環(huán)境,最終通過(guò)理解語(yǔ)言之后,有自我意識(shí)去完成任務(wù)。
WRC 最明顯的趨勢(shì)就是機(jī)器人大腦圍繞 VLA 模型「萬(wàn)模齊開(kāi)」,代表企業(yè)星動(dòng)紀(jì)元、星海圖、千尋智能、銀河通用、靈初智能等等。
去年 12 月,清華大學(xué)唯一持股的企業(yè)星動(dòng)紀(jì)元發(fā)布了強(qiáng)化學(xué)習(xí)訓(xùn)練具身大模型的算法框架 iRe-VLA。
將其融合到具身大模型 ERA-42 中,可以通過(guò)同一個(gè)端到端 VLA 模型,用語(yǔ)音控制高自由度人形機(jī)器人的全身靈巧操作,比如柔性物品分揀、掃碼等等。
在 WRC 上,星動(dòng)紀(jì)元將具身智能大模型 ERA-42 應(yīng)用到全尺寸人形機(jī)器人星動(dòng) L7 中,在現(xiàn)場(chǎng)物流模擬場(chǎng)景中,多臺(tái)星動(dòng) L7 不依靠編程,就可以協(xié)同工作:一臺(tái)負(fù)責(zé)智能分揀包裹,另一臺(tái)負(fù)責(zé)智能掃碼,即便遇到包裹的二維碼在另一面,也能自主翻面,識(shí)別二維碼,學(xué)習(xí)能力提升程度很高。
類似的,靈初智能在今年也基于強(qiáng)化學(xué)習(xí)(RL)的端到端具身 VLA 模型 Psi-R1。
Psi R1 模型提出了快慢腦分層架構(gòu),慢腦 S2 系統(tǒng)專注于推理,輸入 VLA 模型中的殊絕語(yǔ)言以及動(dòng)作信息,負(fù)責(zé)場(chǎng)景抽象理解、任務(wù)規(guī)劃決策。另一個(gè)快腦 S1 專注于高精度的控制。
比較大的變化是,Psi R1 模型會(huì)結(jié)合歷史動(dòng)作與當(dāng)前環(huán)境狀態(tài),理解動(dòng)作的長(zhǎng)期影響,最長(zhǎng)可以完成時(shí)長(zhǎng) 30 分鐘以上的 CoAT 長(zhǎng)線思維鏈。
在 WRC 上,靈初智能的麻將機(jī)器人「大秀特秀」,可以和現(xiàn)場(chǎng)觀眾完成一場(chǎng) 30 分鐘以上的麻將對(duì)局,最驚艷的就是自主完成碰杠這類博弈決策,這類動(dòng)作展示就是 VLA 模型動(dòng)態(tài)構(gòu)建決策鏈的能力。
銀河通用也采用了端到端具身抓取基礎(chǔ)大模型 GraspVLA,在 WRC 上嶄露頭角。
GraspVLA 主要由 VLM 骨干網(wǎng)絡(luò)模塊+動(dòng)作專家模塊組成,其中 VLM 包括了一個(gè) 1.8B 的大語(yǔ)言模型,一個(gè)視覺(jué)編碼器以及一個(gè)可訓(xùn)練投影器。
最終 VLM 模塊負(fù)責(zé)視覺(jué)觀察和文本指令,動(dòng)作模塊負(fù)責(zé)動(dòng)作生成。
銀河通用強(qiáng)調(diào)的優(yōu)勢(shì)在于其模型訓(xùn)練采用通才+專才訓(xùn)練,通才就是利用十億幀的仿真渲染數(shù)據(jù)來(lái)強(qiáng)化模型泛化能力,熟悉物體的環(huán)境變化,專才就在特定場(chǎng)景下進(jìn)行真實(shí)數(shù)據(jù)的針對(duì)性場(chǎng)景訓(xùn)練。
銀河通用專門面向零售行業(yè)開(kāi)發(fā)了端到端具身大模型 GroceryVLA,在 WRC 展臺(tái)上,銀河通用為其人形機(jī)器人 Galbot 開(kāi)辟了小超市,即便 SKU 和商品包裝品類各不相同,Galbot 仍然可以分辨材質(zhì),根據(jù)訂單精準(zhǔn)識(shí)別、抓取商品,交給顧客。
星海圖此次也躬身入局 VLA 模型,在 WRC 上首次帶來(lái)了「真端到端+真全身控制」的 VLA 模型 G0,這套模型已經(jīng)可以通過(guò)語(yǔ)音讓機(jī)器人獨(dú)立在房間里整理床鋪了。
即便 VLA 模型已經(jīng)今年機(jī)器人大腦的熱詞,但同樣是 VLA,各家的技能點(diǎn)也各不相同。
星動(dòng)紀(jì)元?jiǎng)?chuàng)始人陳建宇認(rèn)為,接下來(lái)決定機(jī)器人大腦能力有三點(diǎn):
模型架構(gòu)決定大腦能力上限、數(shù)據(jù)豐富度和數(shù)據(jù)質(zhì)量決定動(dòng)作的完成度,本體的好壞和負(fù)責(zé)都決定執(zhí)行的上限。
因此,面向 VLA 的模型開(kāi)發(fā)仍然是一場(chǎng)漫長(zhǎng)的進(jìn)修之路。
機(jī)器人芯片:英偉達(dá)、地瓜機(jī)器人齊刷臉
本屆 WRC 無(wú)疑成為了各家機(jī)器人的「演武場(chǎng)」,芯片作為機(jī)器人「大腦」的關(guān)鍵組成部分,是決定機(jī)器人感知與決策能力的關(guān)鍵部件。
在眾多機(jī)器人靈活大腦的背后,其實(shí)都有兩位賣鏟人的身影,一個(gè)是英偉達(dá),一個(gè)是地瓜機(jī)器人。
兩位賣鏟人展現(xiàn)了截然不同的機(jī)器人算力路線,英偉達(dá)代表的是「高端通用算力+仿真/訓(xùn)練生態(tài)」,面向需要大模型感知、端側(cè)高并發(fā)推理與復(fù)雜仿真的場(chǎng)景;地瓜機(jī)器人代表的是「低成本/定制化算控一體+開(kāi)發(fā)者生態(tài)」,主攻消費(fèi)級(jí)與結(jié)構(gòu)化場(chǎng)景的規(guī);涞。
作為國(guó)內(nèi)具身智能兩家頭部公司,宇樹(shù)科技和銀河通用成為了英偉達(dá)的客戶。
銀河通用的 G1 Premium 人形機(jī)器人,是首批搭載 NVIDIA Jetson Thor 的人形機(jī)器人之一,在工業(yè)碼垛、拆垛及物料箱搬運(yùn)等復(fù)雜場(chǎng)景中展現(xiàn)出流暢性與作業(yè)速度。
宇樹(shù)科技則在其新型人形機(jī)器人 R1 上部署了英偉達(dá)全棧機(jī)器人技術(shù),通過(guò) Isaac Sim 高仿真平臺(tái)優(yōu)化運(yùn)動(dòng)與操控能力,并借助 Isaac Lab 系統(tǒng)實(shí)現(xiàn)快速策略迭代。
除此之外,像踢足球的加速進(jìn)化 Booster T1,采用的是 Nvidia AGX Orin,提供 200 TOPS AI 算力;星海圖公司的 R1 系列采用的都是 NVIDIA Jetson AGX Orin 32GB;眾擎的 SE01 采用的是 NVIDIA Jetson Orin Nano。
地瓜機(jī)器人此次也展示了 5 家合作伙伴的落地應(yīng)用,涵蓋了從機(jī)械臂到四足機(jī)器人再到人形機(jī)器人。
維他動(dòng)力的全地形自主移動(dòng)伴隨機(jī)器人 Vbot 部署了地瓜機(jī)器人 RDK S100P 作為 AI 大腦,憑借 128TOPS 端側(cè)算力和自動(dòng)駕駛級(jí)傳感器系統(tǒng),能夠?qū)崿F(xiàn)「看得見(jiàn)、聽(tīng)得見(jiàn)、會(huì)思考、能對(duì)話」。
大象機(jī)器人的 myCobot 280 RDK X5 機(jī)械臂采用的是地瓜機(jī)器人 RDK X5 作為 AI 計(jì)算平臺(tái),具有 10TOPS 算力,支持 100+開(kāi)源算法模型,覆蓋 YOLO World、VSLAM、目標(biāo)檢測(cè)、語(yǔ)義交互等場(chǎng)景。
而國(guó)地共建的青龍機(jī)器人則搭載地瓜機(jī)器人 RDK S100P 智能計(jì)算平臺(tái),憑借 128TOPS 端側(cè) AI 算力,實(shí)現(xiàn)「語(yǔ)音-視覺(jué)-抓取」全鏈路閉環(huán)。
從芯片應(yīng)用上,也能發(fā)現(xiàn)「大小腦協(xié)同」將成為常態(tài)。
把實(shí)時(shí)控制、低延遲決策放在本地的小腦如 MCU,把復(fù)雜感知與高層規(guī)劃放到高算力的「大腦」例如 GPU、BPU、NPU 等,由此形成成本與能力兼顧的系統(tǒng)。
地瓜機(jī)器人在 RDK S100 的設(shè)計(jì)理念即主張這種異構(gòu)協(xié)同,而采用英偉達(dá)的整機(jī)更多將「大腦」能力推到端側(cè)以實(shí)現(xiàn)更強(qiáng)感知與在線泛化能力。
機(jī)器人本體:情感需求萌芽,關(guān)鍵部件全自研尚早
整個(gè) WRC,最受關(guān)注的還是機(jī)器人本體企業(yè)。
第一個(gè)最明顯的變化發(fā)生在形態(tài)上,機(jī)器人的尺寸變得更多元。
人形機(jī)器人尺寸主要集中在兩個(gè)范圍,一類是輕量小尺寸機(jī)器人,如宇樹(shù) G1 等,身高集中在 120-130cm 區(qū)間,比如宇樹(shù)第三款人形機(jī)器人 Unitree R1,身高 127cm,整機(jī)重量只有 25kg。
與之相對(duì)的是全尺寸機(jī)器人,身高動(dòng)輒 170cm 以上,典型如特斯拉機(jī)器人擎天柱,身高 172cm,體重 73kg。再比如眾擎機(jī)器人最新發(fā)布的 T800,就宛如巨人,身高 1.85 米,體重 85kg。
在 WRC 上多了很多 140cm—160cm 左右的中小尺寸人形機(jī)器人。魔法原子新推出的小個(gè)子人形機(jī)器人 MagicBot Z1,身高 140cm,體重 40kg,可以秒彈射起身。
這次鹿明機(jī)器人在 WRC 也展出的可一秒彈射起身的 Lumos LUS2,身高 160cm/55kg,外觀上更接近人類。
鹿明聯(lián)合創(chuàng)始人黃浩告訴星河頻率,他們認(rèn)為人形機(jī)器人行業(yè)會(huì)逐漸收斂到 160cm 機(jī)器人的形態(tài)。
背后的原因跟穩(wěn)定性和關(guān)節(jié)尺寸大小、成本有關(guān)。
最核心的原因是身高 160cm 機(jī)器人的重心高度比 120cm 機(jī)器人高出 33%,動(dòng)態(tài)平衡時(shí)的穩(wěn)定性閾值明顯降低,穩(wěn)定性更好。
甚至,鹿明機(jī)器人也在 WRC 上第一次展出了小型人形機(jī)器人 NIX,其身高跟 3 歲小孩相當(dāng)。
第二個(gè)最大的變化在于,本體機(jī)器人有了更多元的情感表達(dá)。
傳統(tǒng)人形機(jī)器人有兩個(gè)方向,一種是仿真級(jí)別的機(jī)器人,把機(jī)器人臉部做得非常逼真,另一種則是外形具備科技感的機(jī)器人,其身體及五官形態(tài)更超人。
傅利葉在 WRC 最新發(fā)布的人形機(jī)器人 GR-3 開(kāi)創(chuàng)了一種新的外觀形態(tài)。
從外觀來(lái)看,傳統(tǒng)機(jī)器人的脖子變成了厚圍脖、原本冰冷的工程塑料上多了一層皮革,外觀色調(diào)從主流的黑白灰變成了更加柔和的配色,從視覺(jué)上削弱了傳統(tǒng)機(jī)器人的冰冷感。
從內(nèi)主打全感交互,GR-3 身上搭載了 31 個(gè)傳感器構(gòu)成觸覺(jué)感知陣列。
呼喚、撫摸 GR-3,就能觸發(fā)「快思考」反饋,快速轉(zhuǎn)頭對(duì)視或者輕晃腦袋回應(yīng),同一指令被多次觸發(fā)就會(huì)啟動(dòng)「慢思考」模式。
由大模型推理引擎理解復(fù)雜語(yǔ)義、交互歷史及觸發(fā)特征,生成更自然且適配場(chǎng)景的應(yīng)答。
這種結(jié)合皮膚觸感的交互形態(tài),給人形機(jī)器人的擬人化提供了一種新的思路。
第三個(gè)變化是自研成為主流方向,但全棧自研為時(shí)尚早。
本體機(jī)器人在大展拳腳時(shí),背后是整個(gè)機(jī)器人產(chǎn)業(yè)鏈的深度融合。整個(gè) WRC 觀察下來(lái),不少企業(yè)為了節(jié)約成本、掌握核心關(guān)鍵技術(shù),有了嘗試核心零部件自研的趨勢(shì)。
目前鹿明機(jī)器人已經(jīng)在自主研發(fā)機(jī)器人關(guān)節(jié)模組、觸覺(jué)夾爪和七軸數(shù)據(jù)采集機(jī)械臂等核心零部件。
黃浩告訴星河頻率,關(guān)節(jié)模組大概占整機(jī)成本 40%,他們選擇自研的部分都屬于成本高、技術(shù)要求高的部分。
但他認(rèn)為整個(gè)通用機(jī)器人行業(yè)其實(shí)都處于比較早期的過(guò)程,談全棧自研為時(shí)尚早。
要先把整體供應(yīng)鏈能力先建立起來(lái),才有可能像汽車企業(yè)那樣從芯片再到軟硬件都趨向于全棧自研。
靈巧手:從單點(diǎn)演示過(guò)渡向場(chǎng)景化、可部署化
靈巧手,作為人形機(jī)器人的最后一厘米,決定了機(jī)器人作業(yè)能力的上限。隨著機(jī)器人本體的穩(wěn)定性上升、市場(chǎng)對(duì)機(jī)器人作業(yè)能力的要求提高,靈巧手也從入場(chǎng)試水的「單點(diǎn)演示」向場(chǎng)景化、可部署化發(fā)展。
今年 WRC 上有 10 家以上靈巧手廠商參展,帶來(lái)了超 20 款靈巧手產(chǎn)品,較去年有了很大的增長(zhǎng)。
在技術(shù)路線上,傳動(dòng)方案呈現(xiàn)多元化,腱繩方案的上場(chǎng)率有了明顯提高。
當(dāng)下,市面上大部分的產(chǎn)品采用的還是連桿方案,自由度在 6-11 的區(qū)間。
而腱繩方案能帶來(lái)更高的自由度,同時(shí)在理論上最能突破靈巧手不可能三角。這次參展的兩款新品靈巧手都采用的都是腱繩方案。
賽博格機(jī)器人 Cyborg-H01 通過(guò)腱繩方案和單電機(jī)驅(qū)動(dòng)多關(guān)節(jié)結(jié)構(gòu),實(shí)現(xiàn)重量傳較統(tǒng)方案降低 40%,成本下降 40% 以上。
曦諾未來(lái) Xynova Flex 1 具備 25 個(gè)自由度,關(guān)節(jié)位置控制精度達(dá) 0.75°,較國(guó)際水平提升 25%。
此外,像靈巧智能這樣全產(chǎn)品線采用腱繩方案的廠商,也展出了三指到五指靈巧手產(chǎn)品。
其中,DexHand021 Pro 作為高自由度靈巧手將在下半年正式發(fā)售。
在 WRC 上,推出 Linker Hand L6 與 L20 工業(yè)版的靈心巧手公司,也展出了采用腱繩方案的、目前自由度最高的靈巧手一一 Linker Hand L30 科研版。
其次,感知與觸覺(jué)在「決策環(huán)」里的權(quán)重上升,高密度觸覺(jué)傳感器逐漸成為一種標(biāo)配。手的靈巧度不能跟自由度的多少掛鉤,觸覺(jué)傳感、力控與多模態(tài)視覺(jué)的深度融合才是真正的衡量標(biāo)準(zhǔn),換言之,要讓機(jī)器人理解「怎么抓、抓多緊、該不該調(diào)整」。
大寰機(jī)器人 DH-5-6 靈巧手在指腹與手掌布設(shè)離子活性層觸覺(jué)陣列,可以實(shí)時(shí)捕捉壓力分布、紋理特征及滑動(dòng)趨勢(shì),支持自適應(yīng)抓取和異常觸碰識(shí)別。
優(yōu)必選的 Walker S2 搭載其自研靈巧手,使用雙目視覺(jué)+陣列觸覺(jué),可識(shí)別不同材質(zhì)的滑動(dòng)摩擦系數(shù),抓取易碎物品時(shí)施加的力波動(dòng)控制在±0.5N 以內(nèi)。
過(guò)去,不少靈巧手廠商偏重于硬件研發(fā),忽略了軟件與算法的協(xié)同。但機(jī)器人要在復(fù)雜場(chǎng)景中精準(zhǔn)作業(yè),必須「軟硬兼施」。
如今,已有廠商開(kāi)始構(gòu)建「硬件 + 算法」的生態(tài)體系。
中科硅紀(jì)在 WRC 上展示了多款智能靈巧手與具身智能整機(jī),展現(xiàn)出了一條路徑:將機(jī)械手的物理能力與大模型、多模態(tài)感知算法結(jié)合,機(jī)器人能根據(jù)不同場(chǎng)景動(dòng)態(tài)調(diào)整抓取策略,讓同一套「手臂+手」可以覆蓋更多應(yīng)用場(chǎng)景,降低集成與現(xiàn)場(chǎng)調(diào)試成本。
傲意科技聯(lián)合艾歐智能、英偉達(dá)打造的「靈巧手+數(shù)據(jù)+場(chǎng)景」開(kāi)放實(shí)驗(yàn)室在WRC首次亮相; NVIDIA VSS 多模態(tài)視覺(jué)大模型,傲意科技的靈巧手在現(xiàn)場(chǎng)演示了復(fù)雜抓取、精密裝配及康復(fù)輔助的實(shí)時(shí)交互。
除此之外,也能明顯感受到靈巧手正在向模塊化和標(biāo)準(zhǔn)化發(fā)展。
各家廠商正努力把「手」做成可插拔、可復(fù)用的模塊,便于在不同品牌機(jī)械臂或整機(jī)上快速替換與集成,從而縮短落地時(shí)間與工程成本。
機(jī)器人眼睛:「眼、腦、手」進(jìn)入升維協(xié)同
去年 WRC 上,他山科技 CEO 馬揚(yáng)表示,機(jī)器人執(zhí)行復(fù)雜動(dòng)作需要統(tǒng)一體完成視覺(jué)與觸覺(jué)的融合。
這一觀點(diǎn)在今年大會(huì)上已成為現(xiàn)實(shí),多傳感器融合已從技術(shù)理想進(jìn)化為產(chǎn)品核心架構(gòu)。
機(jī)器人的「眼睛」正與「大腦」、「手」形成更高效的協(xié)同。
過(guò)去,人形機(jī)器人的視覺(jué)功能多停留在「炫技」或概念展示,而今年視覺(jué)技術(shù)的「生產(chǎn)力屬性」更為明顯,比如多臺(tái)機(jī)器人協(xié)作完成物料分揀、跨區(qū)域配送等實(shí)際任務(wù)。
機(jī)器人不再只是「看得見(jiàn)」,而是在真實(shí)場(chǎng)景中「看得懂、用得上」。
單靠一種傳感器已無(wú)法滿足復(fù)雜場(chǎng)景需求,多源數(shù)據(jù)的時(shí)空融合成為視覺(jué)系統(tǒng)的底層邏輯。
速騰聚創(chuàng)推出的 Active Camera 平臺(tái),采用多傳感器一體化集成,單硬件即可提供色彩信息、深度信息與運(yùn)動(dòng)狀態(tài)信息,并實(shí)現(xiàn)三類信息的時(shí)空融合,突破了傳統(tǒng) 3D 視覺(jué)「看不清、看不準(zhǔn)、反應(yīng)慢」的技術(shù)瓶頸。
奧比中光的 3D 激光雷達(dá) Pulsar ME450 支持三種掃描模式自由切換,是行業(yè)首款「一機(jī)多模」3D 激光雷達(dá),可動(dòng)態(tài)切換以適應(yīng)避障、測(cè)繪等場(chǎng)景,適配物流、戶外作業(yè)等復(fù)雜場(chǎng)景。
這種融合的本質(zhì),是讓機(jī)器人從「看見(jiàn)物體」升級(jí)為「理解環(huán)境」。
在硬件層面,視覺(jué)設(shè)備正朝著「體積更小、性能更強(qiáng)」的方向發(fā)展。
禾賽科技的 JT 系列激光雷達(dá),體積僅臺(tái)球大小,支持行業(yè)最廣的 360°×189°超半球視野和 256 線分辨率,發(fā)布 5 個(gè)月交付量達(dá) 10 萬(wàn)臺(tái)。
其純固態(tài)雷達(dá) FTX 體積較上一代減少 66%,點(diǎn)頻高達(dá) 49.2 萬(wàn)點(diǎn)/秒,可隱蔽嵌入服務(wù)機(jī)器人機(jī)體,實(shí)現(xiàn)「無(wú)感化」感知升級(jí)。
此外,與去年 WRC 討論「感知分離」,即視覺(jué)在腦端處理、觸覺(jué)在邊緣端處理不同,今年呈現(xiàn)明顯的「端-邊-云協(xié)同」趨勢(shì)。硬件廠商不再只賣傳感器,而是構(gòu)建全棧開(kāi)發(fā)生態(tài)。
像速騰聚創(chuàng)的 AI-Ready 生態(tài)就提供了開(kāi)源工具、預(yù)訓(xùn)練算法庫(kù)及數(shù)據(jù)集,吸引場(chǎng)景和算法兩類開(kāi)發(fā)者,推動(dòng)產(chǎn)品落地應(yīng)用以及反向推動(dòng)硬件迭代。
同時(shí),機(jī)器人視覺(jué)的不斷發(fā)展,讓魯棒性成為了產(chǎn)品落地的大前提。
人形、陪伴類機(jī)器人在今年展出數(shù)量大幅增加,尤其是在餐飲、零售、家庭等場(chǎng)景演示越發(fā)頻繁。
相比去年偏靜態(tài)的展示,今年的機(jī)器人能在展館這種復(fù)雜環(huán)境中保持穩(wěn)定工作,例如維他動(dòng)力的 Vbot 在場(chǎng)館里「自由活動(dòng)」,天工機(jī)器人自主「遛彎」到工位。
這要求感知系統(tǒng)必須經(jīng)過(guò)更苛刻的工程驗(yàn)證,這種需求迫使廠商在算法降噪、抗干擾設(shè)計(jì)、軟硬件協(xié)同上持續(xù)優(yōu)化。
這次 WRC 像一面棱鏡,折射出機(jī)器人發(fā)展的核心脈絡(luò):市場(chǎng)不再滿足單點(diǎn)炫技,而在尋找「真有用、能落地」的系統(tǒng)級(jí)進(jìn)化。
無(wú)論是手的靈巧進(jìn)化、視覺(jué)的感知躍遷,還是大腦的智能賦能、本體的穩(wěn)定支撐,最終的關(guān)鍵都藏在技術(shù)的協(xié)同里。
大腦的決策需要眼睛提供精準(zhǔn)的環(huán)境感知;
眼睛的觀察需要手和本體去執(zhí)行驗(yàn)證;
手的靈巧操作依賴本體的穩(wěn)定支撐和大腦的精細(xì)控制;
本體的運(yùn)動(dòng)效能更離不開(kāi)大腦的全局規(guī)劃和眼睛的實(shí)時(shí)反饋。
王興興預(yù)測(cè),未來(lái)幾年,全行業(yè)人形機(jī)器人出貨量每年翻番都是有保證的,如果有更大的技術(shù)突破,甚至可能未來(lái) 2-3 年突然一年出貨幾十萬(wàn)臺(tái),甚至上百萬(wàn)臺(tái)也有可能。
當(dāng)技術(shù)從單點(diǎn)爆破走向多維協(xié)同,機(jī)器人終將撕掉「Demo」的標(biāo)簽,以真正的智能體身份走入各行各業(yè)。
畢竟,評(píng)判一個(gè)機(jī)器人的終極標(biāo)準(zhǔn),從來(lái)不是「能轉(zhuǎn)多少圈」、「識(shí)別多少物體」,而是它是否能真正「接住」人類的需求。
原文標(biāo)題 : 這屆機(jī)器人火力全開(kāi),不止炫技更要落地

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.1立即下載>> 【限時(shí)下載】ADI中國(guó)三十周年感恩回饋助力企業(yè)升級(jí)!
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
精彩回顧立即查看>> 【在線研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車出海美國(guó)
- 2 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 3 阿里首位程序員,“掃地僧”多隆已離職
- 4 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來(lái)新一輪協(xié)同進(jìn)化
- 5 六大國(guó)產(chǎn)大模型,誰(shuí)是最強(qiáng)“金融分析師”?|錦緞評(píng)測(cè)
- 6 2025年第一支10倍股,來(lái)了!
- 7 募資39.85億元!寒武紀(jì)押注大模型芯片與軟件平臺(tái)
- 8 清庫(kù)存?曝英偉達(dá)H20供應(yīng)有限,且沒(méi)有復(fù)產(chǎn)計(jì)劃
- 9 國(guó)內(nèi)免費(fèi)版Deep Research上線,秘塔AI深度研究嘗試重塑知識(shí)工作范式
- 10 賈躍亭再獲 7.5 億元融資,用于新車FF 91 生產(chǎn)交付