侵權(quán)投訴
訂閱
糾錯(cuò)
加入自媒體

大模型真的有助于自動(dòng)駕駛落地嗎?

隨著汽車(chē)智能化發(fā)展,越來(lái)越多新技術(shù)被應(yīng)用到汽車(chē)上,為了能夠讓汽車(chē)更加智能,大模型技術(shù)也開(kāi)始被應(yīng)用到汽車(chē)上,尤其是隨著自動(dòng)駕駛技術(shù)的逐漸落地,大模型的應(yīng)用也更加廣泛,那大模型真的有助于自動(dòng)駕駛嗎?車(chē)企使用大模型,是跟風(fēng),還是真的有用?

大模在自動(dòng)駕駛上的優(yōu)勢(shì)

在聊今天的話題前,要先聊聊什么是“大模型”。相較于我們熟知的在手機(jī)上使用的語(yǔ)言類(lèi)大模型,自動(dòng)駕駛使用的大模型僅限于聊天功能,而是指經(jīng)過(guò)海量數(shù)據(jù)預(yù)訓(xùn)練、擁有豐富表征能力和推理能力的深度模型。它們可以是純語(yǔ)言模型(LLM),也可以是視覺(jué)/視覺(jué)-語(yǔ)言的多模態(tài)模型,或者是將感知、地圖、軌跡等多模態(tài)數(shù)據(jù)聯(lián)合建模的巨型網(wǎng)絡(luò)。大模型的核心特點(diǎn)是強(qiáng)大的表征學(xué)習(xí)能力、遷移學(xué)習(xí)能力和在少量示例下進(jìn)行任務(wù)適配的能力。把這些能力放到自動(dòng)駕駛場(chǎng)景,會(huì)帶來(lái)哪些直接好處?

第一個(gè)顯著優(yōu)勢(shì)是“語(yǔ)義化與通用表征”。傳統(tǒng)自動(dòng)駕駛系統(tǒng)往往依賴(lài)大量手工設(shè)計(jì)的像是各類(lèi)目標(biāo)框、車(chē)道線、交通標(biāo)志分類(lèi)等中間表示和專(zhuān)門(mén)標(biāo)簽。大模型通過(guò)自監(jiān)督學(xué)習(xí)可以把圖像、雷達(dá)點(diǎn)云、軌跡序列、地圖要素等聯(lián)合編碼成高維語(yǔ)義向量,這種向量更能捕獲場(chǎng)景的高階關(guān)系,比如“這是一個(gè)繁忙交叉口、行人群集且有遮擋”的整體語(yǔ)義,而不是單個(gè)像素或點(diǎn)的局部判斷。這樣的表征對(duì)下游任務(wù)(場(chǎng)景理解、行為預(yù)測(cè)、決策輔助)有天然幫助,尤其在稀疏樣本或長(zhǎng)尾場(chǎng)景上,表現(xiàn)出更好的遷移能力。

第二個(gè)好處是“少樣本學(xué)習(xí)與知識(shí)遷移”。大模型在海量多樣數(shù)據(jù)上預(yù)訓(xùn)練后,能把常識(shí)性知識(shí)和駕駛經(jīng)驗(yàn)以分布式權(quán)重的形式存儲(chǔ)。當(dāng)遇到新城市、新氣候或未見(jiàn)過(guò)的路口設(shè)計(jì)時(shí),通過(guò)少量標(biāo)注或在線微調(diào),模型往往能夠更快適應(yīng)。對(duì)于工程上要頻繁覆蓋新場(chǎng)景的車(chē)隊(duì)來(lái)說(shuō),這一點(diǎn)能顯著降低標(biāo)注成本和模型迭代周期。

第三個(gè)好處是“多模態(tài)推理與統(tǒng)一接口”。自動(dòng)駕駛汽車(chē)對(duì)于交通環(huán)境的理解主要來(lái)自攝像頭、激光雷達(dá)、毫米波雷達(dá)、高清地圖、V2X等,大模型可以作為一個(gè)統(tǒng)一的推理層,把這些輸入融合在一起,輸出對(duì)場(chǎng)景的高層語(yǔ)義解釋或候選行為策略。相比傳統(tǒng)的硬編碼規(guī)則或松耦合模塊化方案,這種統(tǒng)一的推理有時(shí)能更好地處理信息不一致或局部傳感器失效的情況,提供更穩(wěn)健的備選解。

此外,大模型在工程流水線上的價(jià)值也很明顯,它可以自動(dòng)化標(biāo)注、生成難例、合成訓(xùn)練場(chǎng)景、寫(xiě)測(cè)試用例、做仿真場(chǎng)景擴(kuò)展,甚至參與代碼生成與日志分析。把大量重復(fù)性、勞動(dòng)力密集的工作交給大模型,能把工程師從低價(jià)值的任務(wù)中解放出來(lái),集中做架構(gòu)設(shè)計(jì)和安全評(píng)估。

大模型在自動(dòng)駕駛上的風(fēng)險(xiǎn)

理解了優(yōu)勢(shì),再來(lái)聊聊不足。首先是“實(shí)時(shí)性與算力”的挑戰(zhàn)。大模型需要的參數(shù)量巨大,運(yùn)行在車(chē)端直接做閉環(huán)控制在當(dāng)前算力與功耗預(yù)算下并不現(xiàn)實(shí)。即便采用剪枝、蒸餾或量化,依然需要小心平衡延遲和性能。自動(dòng)駕駛對(duì)延遲、確定性和可預(yù)測(cè)性的要求極高,任何一次決策的延遲或抖動(dòng)都可能變成安全隱患。

其次是“可驗(yàn)證性與可解釋性”問(wèn)題。想要確保自動(dòng)駕駛汽車(chē)安全行駛,每一個(gè)動(dòng)作都需要可證明的行為邊界和可審計(jì)的決策鏈路。大模型本質(zhì)上是統(tǒng)計(jì)學(xué)習(xí)器,其推理過(guò)程并不天然滿足形式化驗(yàn)證要求。把一個(gè)黑箱模型放在決策閉環(huán)中,會(huì)讓安全審計(jì)、法規(guī)合規(guī)、事故歸因等工作變得復(fù)雜。為此要在使用大模型時(shí)加上可解釋的中間表示、約束層和冗余控制回退策略。

還有就是魯棒性與長(zhǎng)尾場(chǎng)景處理能力。雖然大模型在遷移學(xué)習(xí)上表現(xiàn)優(yōu)異,但在極端場(chǎng)景、傳感器惡劣失真或?qū)剐暂斎胂氯钥赡苁。自?dòng)駕駛的風(fēng)險(xiǎn)集中在長(zhǎng)尾事件上,而這些事件往往缺乏足夠數(shù)據(jù)供大模型預(yù)訓(xùn)練時(shí)學(xué)習(xí)到,因此不能把所有安全希望寄托在模型“學(xué)會(huì)”偶發(fā)事故上。

最后就是“分發(fā)式責(zé)任與法規(guī)風(fēng)險(xiǎn)”。把決策權(quán)交給一個(gè)學(xué)得來(lái)的模型會(huì)引發(fā)責(zé)任界定問(wèn)題。無(wú)論是車(chē)企、軟硬件供應(yīng)商還是服務(wù)運(yùn)營(yíng)方,誰(shuí)為模型決策的失誤負(fù)責(zé),法律和保險(xiǎn)生態(tài)尚在適配階段。在某些國(guó)家和地區(qū),監(jiān)管機(jī)構(gòu)對(duì)黑箱決策持謹(jǐn)慎態(tài)度,這會(huì)影響技術(shù)落地節(jié)奏。

大模型如何合理利用于自動(dòng)駕駛?

那么在自動(dòng)駕駛汽車(chē)上應(yīng)如何合理利用大模型?實(shí)踐中比較合理的路徑是“模塊化+大模型輔助”的混合架構(gòu)。把感知(像素到對(duì)象、幾何重建)、定位與映射、控制等關(guān)鍵實(shí)時(shí)環(huán)節(jié)仍然由高頻、經(jīng)過(guò)嚴(yán)格驗(yàn)證的模塊承擔(dān);把大模型放在如場(chǎng)景解釋、長(zhǎng)時(shí)程行為預(yù)測(cè)、復(fù)雜交互推理、異常檢測(cè)、策略建議和仿真場(chǎng)景生成等“中高層推理”或“離線路徑”上。這樣既能利用大模型的長(zhǎng)處,又能保留低延遲和可驗(yàn)證的控制路徑。

為了實(shí)現(xiàn)工業(yè)級(jí)落地,可采用蒸餾與層次化部署。先在云端用大模型完成復(fù)雜推理或策略搜索,生成穩(wěn)定的策略候選或結(jié)構(gòu)化指令,然后把這些知識(shí)蒸餾到輕量化、可實(shí)時(shí)運(yùn)行的模型(或基于規(guī)則的控制器)中,并部署到車(chē)端。這樣既能把通用知識(shí)轉(zhuǎn)移到邊緣設(shè)備,又能保證每次決策的可控性與時(shí)效性。

在訓(xùn)練方法上,大模型的引入也改變了數(shù)據(jù)策略。自監(jiān)督學(xué)習(xí)(例如對(duì)比學(xué)習(xí)、掩碼建模)在多模態(tài)數(shù)據(jù)上能學(xué)習(xí)通用特征,減少對(duì)昂貴標(biāo)簽的依賴(lài);仿真生成與合成數(shù)據(jù)在補(bǔ)齊長(zhǎng)尾場(chǎng)景方面作用明顯,但需要做好域適配(sim2real)。行為級(jí)的訓(xùn)練則結(jié)合示范學(xué)習(xí)、離線強(qiáng)化學(xué)習(xí)和人類(lèi)專(zhuān)家驗(yàn)證,避免模型在現(xiàn)實(shí)世界里進(jìn)行危險(xiǎn)的在線試錯(cuò)。數(shù)據(jù)治理、標(biāo)注質(zhì)量控制和場(chǎng)景覆蓋評(píng)估,依然是能否把模型成功推向量產(chǎn)的關(guān)鍵。

在評(píng)估與驗(yàn)證時(shí),使用大模型并不意味著可以放松測(cè)試。相反,需要更嚴(yán)密的場(chǎng)景覆蓋度指標(biāo)、基于場(chǎng)景的安全指標(biāo)以及對(duì)模型不確定性的量化。對(duì)不確定性的估計(jì)(例如置信區(qū)間、貝葉斯近似或深度集成)在運(yùn)行時(shí)能觸發(fā)切換策略或請(qǐng)求人工介入。覆蓋測(cè)試要包含傳感器失效、遮擋、惡劣天氣、稀有行為體等長(zhǎng)尾場(chǎng)景,同時(shí)結(jié)合覆蓋引導(dǎo)的對(duì)抗測(cè)試來(lái)查找潛在失敗模式。

使用了大模型,并不意味著自動(dòng)駕駛汽車(chē)可以完全智能,冗余和監(jiān)控依然不可或缺。即使大模型提供了高質(zhì)量的建議,系統(tǒng)也應(yīng)有兩個(gè)獨(dú)立鏈路來(lái)核驗(yàn)輸出,并在不一致時(shí)執(zhí)行簡(jiǎn)單、安全的停止或降級(jí)措施。運(yùn)行時(shí)監(jiān)控要包括模型輸入管線的完整性檢查、輸出一致性檢查、以及隨時(shí)間漂移的性能回歸檢測(cè)。在線日志和回放機(jī)制同樣重要,事故發(fā)生后必須能回溯每一步?jīng)Q策和模型輸入以支持責(zé)任認(rèn)定與模型改進(jìn)。

對(duì)于研發(fā)團(tuán)隊(duì)而言,落地大模型的成本和工程量也不容忽視。模型訓(xùn)練需要大量算力和存儲(chǔ),數(shù)據(jù)標(biāo)注與清洗仍是主要開(kāi)銷(xiāo)之一?梢韵仍诜抡婧烷]環(huán)測(cè)試臺(tái)架上驗(yàn)證大模型的推理能力,再在封閉場(chǎng)地、限定場(chǎng)景的道路測(cè)試中做安全下沉。

最后的話

對(duì)于很多專(zhuān)門(mén)從事自動(dòng)駕駛大模型的小伙伴以及一些剛進(jìn)入這一行的同學(xué),智駕最前沿想提一些建議。第一,掌握基礎(chǔ)的感知與幾何知識(shí)仍然是根基。無(wú)論未來(lái)模型怎樣發(fā)展,攝像頭、LiDAR、雷達(dá)的物理測(cè)量特性和幾何約束始終決定了可獲得信息的上限。第二,理解模型的不確定性很重要。會(huì)使用大模型和知道什么時(shí)候不用它,同樣是工程能力。第三,從小切口試水,先把大模型用在比如輔助標(biāo)注、生成訓(xùn)練場(chǎng)景、做日志分析或提供多模態(tài)檢索等非關(guān)鍵路徑上,以積累工程經(jīng)驗(yàn)和安全方式論證。第四,重視數(shù)據(jù)治理和場(chǎng)景覆蓋,良好的數(shù)據(jù)策略比單純堆模型參數(shù)更能提升系統(tǒng)安全性。第五,若是在帶領(lǐng)團(tuán)隊(duì),要建立跨學(xué)科的團(tuán)隊(duì),把算法工程師、系統(tǒng)工程師、功能安全工程師和驗(yàn)證工程師放在同一項(xiàng)目里,確保模型的研發(fā)和驗(yàn)證能夠互相制衡。

其實(shí)大模型帶來(lái)的并不是單一的“萬(wàn)能解”,而是一個(gè)能夠顯著提升認(rèn)知、生成和推理能力的新工具箱。它能加速數(shù)據(jù)閉環(huán)、提升對(duì)復(fù)雜場(chǎng)景的理解、改善人機(jī)交互、并在工程流程中提高效率。但它不是直接替代所有傳統(tǒng)模塊的捷徑;在安全關(guān)鍵的閉環(huán)控制上,黑箱式的大模型仍然難以滿足可驗(yàn)證性與確定性的要求。合理的路徑是把大模型視為“認(rèn)知增強(qiáng)器”和“工程放大器”,在不降低系統(tǒng)可控性的前提下逐步滲透到感知、預(yù)測(cè)、規(guī)劃的上層、以及數(shù)據(jù)與仿真流水線里。

-- END --

       原文標(biāo)題 : 大模型真的有助于自動(dòng)駕駛落地嗎?

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)