訂閱
糾錯
加入自媒體

Helix系統(tǒng):感知和動作控制技術(shù)將推動人形機器人落地物流場景

芝能科技出品

Figure 推出的 Helix 系統(tǒng)正通過將“視覺-語言-動作”模型與先進的控制策略相融合,加速人形機器人在物流行業(yè)中的部署與擴展。

Helix 的核心技術(shù)體系,圍繞立體視覺、多尺度表征、自我校準(zhǔn)與高效運動規(guī)劃,在動態(tài)、高復(fù)雜度的現(xiàn)實任務(wù)中展現(xiàn)了類人水平的適應(yīng)性與操作能力。

借助優(yōu)化的數(shù)據(jù)利用方法與跨機器人遷移能力,Helix 打破了傳統(tǒng)機器人對硬件一致性和大量訓(xùn)練數(shù)據(jù)的依賴,為未來具身智能的可規(guī)模化落地奠定了基礎(chǔ)。

01

Helix的核心感知與控制系統(tǒng)設(shè)計:

融合類人認知與工業(yè)效率

Helix 的基礎(chǔ)架構(gòu)圍繞“視覺-語言-動作”(VLA)模型構(gòu)建,在此架構(gòu)下,機器人的感知、理解與執(zhí)行行為成為連續(xù)的閉環(huán)。

其核心子系統(tǒng) System 1(S1)可被視作機器人“低層神經(jīng)網(wǎng)絡(luò)”,承擔(dān)實時感知與動作生成。S1 的最新迭代將多個關(guān)鍵技術(shù)融合進系統(tǒng)中,包括隱式立體視覺、多尺度視覺處理、本體感知學(xué)習(xí)與運動模式生成。

● 隱式立體視覺,精準(zhǔn)三維環(huán)境重建:傳統(tǒng)機器人感知系統(tǒng);趩文繄D像或顯式雙目立體視覺,但前者難以獲取深度信息,后者則對硬件標(biāo)定依賴極高。

Helix 所采用的隱式立體視覺技術(shù),通過融合多個時序圖像幀與傳感器反饋,實現(xiàn)無需外部校準(zhǔn)的三維空間理解能力。這一機制不僅提升了深度估計精度,也顯著提高了對非標(biāo)準(zhǔn)形狀(如軟包裝袋、變形郵袋)的處理可靠性。

● 多尺度視覺表征:兼顧局部細節(jié)與全局場景:Helix 能在處理物流任務(wù)中同時感知細小的局部特征(如條形碼標(biāo)簽的旋轉(zhuǎn)方向)與環(huán)境級信息(如傳送帶的全局路徑與速度),依托的是多尺度視覺處理網(wǎng)絡(luò)。

該網(wǎng)絡(luò)將不同分辨率的圖像特征進行融合,使模型能夠精準(zhǔn)理解操作對象在場景中的幾何與語義屬性。

● 學(xué)習(xí)型視覺本體感覺,機器人之間的自適應(yīng)遷移:在多機器人部署中,機械臂微小的裝配偏差或傳感器位置的差異可能引發(fā)系統(tǒng)級誤差。

Helix 在每個機器人中嵌入視覺驅(qū)動的本體感知模塊,使其能在運行時不斷調(diào)整感知與動作策略以適應(yīng)個體差異。

具體而言,系統(tǒng)利用視覺反饋不斷重建自身關(guān)節(jié)空間與運動結(jié)果之間的映射關(guān)系,并動態(tài)優(yōu)化控制策略,從而實現(xiàn)設(shè)備級別的在線自校準(zhǔn)。

● 高速運動模式:壓縮執(zhí)行時間不犧牲精度:傳統(tǒng)的模仿學(xué)習(xí)常通過將人類動作軌跡離散化執(zhí)行以換取穩(wěn)定性。但 Helix 引入了“運動模式重采樣”技術(shù),使機器人可以在保持軌跡形狀不變的情況下大幅度提高執(zhí)行速度。

通過對軌跡中低風(fēng)險區(qū)域進行時間壓縮,系統(tǒng)平均執(zhí)行效率可提升 50%,尤其適用于高速、高通量的包裹分揀作業(yè)。

Helix 的感知與控制系統(tǒng)融合了機器視覺中的空間建模、多分辨率特征提取與嵌入式本體學(xué)習(xí),實現(xiàn)了動態(tài)環(huán)境下對操作對象的快速理解與高效動作生成,為物流行業(yè)中典型的“非結(jié)構(gòu)化、多變物體處理”任務(wù)提供了技術(shù)基礎(chǔ)。

02

從數(shù)據(jù)到部署:

Helix如何實現(xiàn)低數(shù)據(jù)依賴

與跨設(shè)備可擴展性

工業(yè)級人工智能系統(tǒng)面臨的兩個關(guān)鍵挑戰(zhàn),一是訓(xùn)練數(shù)據(jù)質(zhì)量與效率,二是訓(xùn)練成果在不同硬件平臺間的泛化能力。Helix 在這兩方面均進行了系統(tǒng)性的工程優(yōu)化,進一步推動其在人形機器人上的實際部署。

● 精選數(shù)據(jù)訓(xùn)練策略,8小時演示可達專家級性能:Helix 放棄了對海量低質(zhì)量示例的依賴,轉(zhuǎn)向精細策劃的高質(zhì)量人類演示。

這種示范數(shù)據(jù)以“成功執(zhí)行、高效路徑、動作穩(wěn)定”為篩選標(biāo)準(zhǔn),并融入失敗案例的對比學(xué)習(xí)機制,使得模型不僅學(xué)會“怎么做”,也能理解“什么是最優(yōu)”。

通過這種策略,Helix 僅用 8 小時的人類演示數(shù)據(jù),便能達到包裹處理任務(wù)中專家級的靈活性與決策水平。

● 從最優(yōu)軌跡中提取泛化策略:為了適應(yīng)現(xiàn)實中包裹尺寸、形狀、材質(zhì)的變化,Helix 的訓(xùn)練策略重點不是覆蓋所有可能組合,而是提取能泛化的操作原理。

例如,它學(xué)習(xí)如何基于邊緣輪廓和表面材質(zhì)預(yù)測抓取點,而非僅記憶特定對象的抓取動作。這種方法大幅提高了系統(tǒng)對新場景、新對象的適應(yīng)能力。

● 跨機器人遷移,視覺驅(qū)動的策略映射機制:由于各機器人之間在硬件組件上的微差異往往影響控制策略,傳統(tǒng)方案需要針對每臺設(shè)備單獨調(diào)試。

Helix 引入的視覺本體感知機制能夠感知并修正各機器人之間的剛體誤差、傳感器對準(zhǔn)偏差與響應(yīng)時延。該機制通過少量環(huán)境交互樣本,在數(shù)分鐘內(nèi)即可實現(xiàn)策略遷移。

● 面向車隊部署的架構(gòu)優(yōu)化:在物流中心部署十臺、甚至上百臺機器人時,系統(tǒng)穩(wěn)定性和一致性要求極高。

Helix 的軟硬件協(xié)同框架支持統(tǒng)一版本管理、策略同步與遠程更新,結(jié)合本地自我校準(zhǔn)功能,確保不同機器人在高強度運行下維持一致性能。

Helix 通過數(shù)據(jù)驅(qū)動策略設(shè)計與系統(tǒng)級結(jié)構(gòu)調(diào)整,使人形機器人具備“少量訓(xùn)練-高效執(zhí)行-跨設(shè)備泛化”的能力,突破了傳統(tǒng)機器人系統(tǒng)在部署與維護成本上的限制,朝向工業(yè)級可擴展自動化邁出關(guān)鍵一步。

小結(jié)

在傳統(tǒng)機器人多依賴結(jié)構(gòu)化環(huán)境與重復(fù)性任務(wù)的背景下,Helix 以高維感知、動態(tài)控制與跨設(shè)備泛化能力,率先解決了現(xiàn)實物流場景中的“復(fù)雜物體+動態(tài)操作”難題。其所構(gòu)建的技術(shù)體系,真正讓人形機器人擁有了在工業(yè)環(huán)境中“像人一樣工作”的能力。

Helix 通過其在數(shù)據(jù)效率、設(shè)備適配和執(zhí)行速度上的突破,為未來人形機器人在制造、護理、服務(wù)等更多領(lǐng)域的落地提供了參考。 

       原文標(biāo)題 : Helix系統(tǒng):感知和動作控制技術(shù)將推動人形機器人落地物流場景

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號