Helix系統(tǒng):感知和動作控制技術(shù)將推動人形機器人落地物流場景
芝能科技出品
Figure 推出的 Helix 系統(tǒng)正通過將“視覺-語言-動作”模型與先進的控制策略相融合,加速人形機器人在物流行業(yè)中的部署與擴展。
Helix 的核心技術(shù)體系,圍繞立體視覺、多尺度表征、自我校準(zhǔn)與高效運動規(guī)劃,在動態(tài)、高復(fù)雜度的現(xiàn)實任務(wù)中展現(xiàn)了類人水平的適應(yīng)性與操作能力。
借助優(yōu)化的數(shù)據(jù)利用方法與跨機器人遷移能力,Helix 打破了傳統(tǒng)機器人對硬件一致性和大量訓(xùn)練數(shù)據(jù)的依賴,為未來具身智能的可規(guī)模化落地奠定了基礎(chǔ)。
01
Helix的核心感知與控制系統(tǒng)設(shè)計:
融合類人認知與工業(yè)效率
Helix 的基礎(chǔ)架構(gòu)圍繞“視覺-語言-動作”(VLA)模型構(gòu)建,在此架構(gòu)下,機器人的感知、理解與執(zhí)行行為成為連續(xù)的閉環(huán)。
其核心子系統(tǒng) System 1(S1)可被視作機器人“低層神經(jīng)網(wǎng)絡(luò)”,承擔(dān)實時感知與動作生成。S1 的最新迭代將多個關(guān)鍵技術(shù)融合進系統(tǒng)中,包括隱式立體視覺、多尺度視覺處理、本體感知學(xué)習(xí)與運動模式生成。
● 隱式立體視覺,精準(zhǔn)三維環(huán)境重建:傳統(tǒng)機器人感知系統(tǒng);趩文繄D像或顯式雙目立體視覺,但前者難以獲取深度信息,后者則對硬件標(biāo)定依賴極高。
Helix 所采用的隱式立體視覺技術(shù),通過融合多個時序圖像幀與傳感器反饋,實現(xiàn)無需外部校準(zhǔn)的三維空間理解能力。這一機制不僅提升了深度估計精度,也顯著提高了對非標(biāo)準(zhǔn)形狀(如軟包裝袋、變形郵袋)的處理可靠性。
● 多尺度視覺表征:兼顧局部細節(jié)與全局場景:Helix 能在處理物流任務(wù)中同時感知細小的局部特征(如條形碼標(biāo)簽的旋轉(zhuǎn)方向)與環(huán)境級信息(如傳送帶的全局路徑與速度),依托的是多尺度視覺處理網(wǎng)絡(luò)。
該網(wǎng)絡(luò)將不同分辨率的圖像特征進行融合,使模型能夠精準(zhǔn)理解操作對象在場景中的幾何與語義屬性。
● 學(xué)習(xí)型視覺本體感覺,機器人之間的自適應(yīng)遷移:在多機器人部署中,機械臂微小的裝配偏差或傳感器位置的差異可能引發(fā)系統(tǒng)級誤差。
Helix 在每個機器人中嵌入視覺驅(qū)動的本體感知模塊,使其能在運行時不斷調(diào)整感知與動作策略以適應(yīng)個體差異。
具體而言,系統(tǒng)利用視覺反饋不斷重建自身關(guān)節(jié)空間與運動結(jié)果之間的映射關(guān)系,并動態(tài)優(yōu)化控制策略,從而實現(xiàn)設(shè)備級別的在線自校準(zhǔn)。
● 高速運動模式:壓縮執(zhí)行時間不犧牲精度:傳統(tǒng)的模仿學(xué)習(xí)常通過將人類動作軌跡離散化執(zhí)行以換取穩(wěn)定性。但 Helix 引入了“運動模式重采樣”技術(shù),使機器人可以在保持軌跡形狀不變的情況下大幅度提高執(zhí)行速度。
通過對軌跡中低風(fēng)險區(qū)域進行時間壓縮,系統(tǒng)平均執(zhí)行效率可提升 50%,尤其適用于高速、高通量的包裹分揀作業(yè)。
Helix 的感知與控制系統(tǒng)融合了機器視覺中的空間建模、多分辨率特征提取與嵌入式本體學(xué)習(xí),實現(xiàn)了動態(tài)環(huán)境下對操作對象的快速理解與高效動作生成,為物流行業(yè)中典型的“非結(jié)構(gòu)化、多變物體處理”任務(wù)提供了技術(shù)基礎(chǔ)。
02
從數(shù)據(jù)到部署:
Helix如何實現(xiàn)低數(shù)據(jù)依賴
與跨設(shè)備可擴展性
工業(yè)級人工智能系統(tǒng)面臨的兩個關(guān)鍵挑戰(zhàn),一是訓(xùn)練數(shù)據(jù)質(zhì)量與效率,二是訓(xùn)練成果在不同硬件平臺間的泛化能力。Helix 在這兩方面均進行了系統(tǒng)性的工程優(yōu)化,進一步推動其在人形機器人上的實際部署。
● 精選數(shù)據(jù)訓(xùn)練策略,8小時演示可達專家級性能:Helix 放棄了對海量低質(zhì)量示例的依賴,轉(zhuǎn)向精細策劃的高質(zhì)量人類演示。
這種示范數(shù)據(jù)以“成功執(zhí)行、高效路徑、動作穩(wěn)定”為篩選標(biāo)準(zhǔn),并融入失敗案例的對比學(xué)習(xí)機制,使得模型不僅學(xué)會“怎么做”,也能理解“什么是最優(yōu)”。
通過這種策略,Helix 僅用 8 小時的人類演示數(shù)據(jù),便能達到包裹處理任務(wù)中專家級的靈活性與決策水平。
● 從最優(yōu)軌跡中提取泛化策略:為了適應(yīng)現(xiàn)實中包裹尺寸、形狀、材質(zhì)的變化,Helix 的訓(xùn)練策略重點不是覆蓋所有可能組合,而是提取能泛化的操作原理。
例如,它學(xué)習(xí)如何基于邊緣輪廓和表面材質(zhì)預(yù)測抓取點,而非僅記憶特定對象的抓取動作。這種方法大幅提高了系統(tǒng)對新場景、新對象的適應(yīng)能力。
● 跨機器人遷移,視覺驅(qū)動的策略映射機制:由于各機器人之間在硬件組件上的微差異往往影響控制策略,傳統(tǒng)方案需要針對每臺設(shè)備單獨調(diào)試。
Helix 引入的視覺本體感知機制能夠感知并修正各機器人之間的剛體誤差、傳感器對準(zhǔn)偏差與響應(yīng)時延。該機制通過少量環(huán)境交互樣本,在數(shù)分鐘內(nèi)即可實現(xiàn)策略遷移。
● 面向車隊部署的架構(gòu)優(yōu)化:在物流中心部署十臺、甚至上百臺機器人時,系統(tǒng)穩(wěn)定性和一致性要求極高。
Helix 的軟硬件協(xié)同框架支持統(tǒng)一版本管理、策略同步與遠程更新,結(jié)合本地自我校準(zhǔn)功能,確保不同機器人在高強度運行下維持一致性能。
Helix 通過數(shù)據(jù)驅(qū)動策略設(shè)計與系統(tǒng)級結(jié)構(gòu)調(diào)整,使人形機器人具備“少量訓(xùn)練-高效執(zhí)行-跨設(shè)備泛化”的能力,突破了傳統(tǒng)機器人系統(tǒng)在部署與維護成本上的限制,朝向工業(yè)級可擴展自動化邁出關(guān)鍵一步。
小結(jié)
在傳統(tǒng)機器人多依賴結(jié)構(gòu)化環(huán)境與重復(fù)性任務(wù)的背景下,Helix 以高維感知、動態(tài)控制與跨設(shè)備泛化能力,率先解決了現(xiàn)實物流場景中的“復(fù)雜物體+動態(tài)操作”難題。其所構(gòu)建的技術(shù)體系,真正讓人形機器人擁有了在工業(yè)環(huán)境中“像人一樣工作”的能力。
Helix 通過其在數(shù)據(jù)效率、設(shè)備適配和執(zhí)行速度上的突破,為未來人形機器人在制造、護理、服務(wù)等更多領(lǐng)域的落地提供了參考。
原文標(biāo)題 : Helix系統(tǒng):感知和動作控制技術(shù)將推動人形機器人落地物流場景

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機器人及智能工廠展
-
7月31日免費預(yù)約>> OFweek 2025 具身機器人動力電池技術(shù)應(yīng)用大會
-
免費參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍皮書》
-
8月5日立即報名>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
-
8月14日立即報名>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機器人借殼上市,A股人形機器人第一股!
- 8 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進化