意料之外的AI硬件巨頭
文:詩與星空(ID: SingingUnderStars)
很多年前,曾經(jīng)很流行一種網(wǎng)絡(luò)游戲,叫MUD(也叫玩泥巴,現(xiàn)在依然有很多MUD服務(wù)器,但玩家大多是上古遺留人士)。
這種游戲沒有圖形界面,人機(jī)交互靠的是文本,早期還都是英文,后來支持漢字。
比如,到了一個地方,輸入look,系統(tǒng)會告訴你,這是哪里,有什么,然后嗖對方一箭射過來,你就昏迷了過去。
最近一直高強(qiáng)度使用ChatGPT、Claude、文心一言等生成式通用人工智能,突然想到一件事:如果把這些AI工具,接入硬件設(shè)備會怎樣?
還真有人在這么干,一個是微軟,一個是谷歌。
01
微軟畫得大餅
2月20日,微軟發(fā)布了"ChatGPT for Robotics"的技術(shù)報告,為如何將ChatGPT 融入機(jī)器人領(lǐng)域提供了一種可能的視角。
與純文本的應(yīng)用不同,機(jī)器人系統(tǒng)需要對現(xiàn)實世界的物理、環(huán)境背景和物理動作的執(zhí)行能力有深入的了解。
而且所生成機(jī)器人模型需要具備相當(dāng)?shù)某WR性知識和符合實際的物理模型,以及與用戶交互以解釋和執(zhí)行實際現(xiàn)實中可行的命令。
從報告來看,非常像玩MUD。
1.首先需要手工設(shè)計一系列的機(jī)器人功能庫函數(shù)來實現(xiàn)底層執(zhí)行器的命令,如,移動,停止,獲得目標(biāo)的位置信息等等。
2.第二步是給ChatGPT 寫一個提示詞,用來描述需要讓ChatGPT 執(zhí)行的目標(biāo)。
3.第三步是使用者評估ChatGPT 生成的代碼,并且給ChatGPT 提供反饋,讓ChatGPT 進(jìn)行下一步改進(jìn)。
4.通過提供反饋,將代碼進(jìn)行不斷迭代改進(jìn),當(dāng)測試通過之后,就可以部署到實際的系統(tǒng)中了。
經(jīng)過對ChatGPT特定訓(xùn)練后(其實是一種lora),形成穩(wěn)定的版本,ChatGPT在理解了“自然語言”后,把指令分解通知機(jī)器人,然后調(diào)取其傳感器,根據(jù)反饋結(jié)果進(jìn)行下一步處理。
在ChatGPT出現(xiàn)之前,人和機(jī)器人(其他設(shè)備類似)交互是一種非常專業(yè)的事情,一般由設(shè)備廠件提供標(biāo)準(zhǔn)的交互軟件,如果可以定制,再給一個可以調(diào)用的SDK,所有操作幾乎都是提前寫死的,幾乎做不到全自動的運(yùn)動。
像大疆能夠做到自主反饋,已經(jīng)是機(jī)械設(shè)備領(lǐng)域的巔峰了。
AI改變了這一切。
02
谷歌做的樣機(jī)
3月10日左右,谷歌發(fā)布了一段視頻,基于一個名叫PaLM-E的大模型。
通過這個大模型的驅(qū)動,機(jī)器人可以按照人類的指令去拿零食、拿可樂。
如果說微軟的技術(shù)報告還在PPT階段的話,谷歌已經(jīng)實現(xiàn)了工程樣機(jī)。
現(xiàn)在回過頭來再思考當(dāng)年谷歌為什么收購波士頓動力,似乎恍然大悟。
可惜的是,在大模型方面谷歌沒能第一時間領(lǐng)先,波士頓動力也因成本過高出手。
比如給它一張圖片,然后讓它根據(jù)所看到的做出蛋糕。
模型能先判斷出圖像中都有什么,然后分成9步講了該如何制作蛋糕,從最初的磕雞蛋到最后洗碗都包括在內(nèi)。
03
大模型從NLP到CV
ChatGPT也好,文心一言也好,現(xiàn)在大模型的應(yīng)用主要用在NLP(自然語言處理)領(lǐng)域,實際應(yīng)用以交互對話為主。
而機(jī)器人的領(lǐng)域,是CV(機(jī)器視覺),這個領(lǐng)域的人工智能最領(lǐng)先的國家是誰?
中國。
2022 年,CVPR 大會的投稿量達(dá)到 8161 份,相比 2021 年度的 7093 份提交增長了 15%。其中 44.59% 的作者來自中國,排在第二名的是美國,占據(jù) 20.65%。
同濟(jì)研二在讀,達(dá)摩院研究型實習(xí)生獲得了最佳學(xué)生論文獎。
同濟(jì)、清華、阿里達(dá)摩院等學(xué)術(shù)機(jī)構(gòu)大獎拿到手軟,很多國內(nèi)企業(yè)也大放異彩,比如商湯有 66 篇論文入選,還拿到了 CVPR 2021 ActivityNet 時序動作檢測任務(wù)弱監(jiān)督學(xué)習(xí)賽道冠軍以及 CVPR 2021 NTIRE 視頻理解挑戰(zhàn)賽的三項冠軍;快手也有 14 篇論文被接收,涵蓋三維視覺、目標(biāo)檢測、視頻目標(biāo)分割、人臉偽造技術(shù)檢測等熱門研究領(lǐng)域
換言之,ChatGPT嘴皮子功夫再厲害,最終還是要喂給機(jī)器,這才是真正的生產(chǎn)力。
到了這個環(huán)節(jié),就是中國人的天下了。所以完全不用擔(dān)心AI領(lǐng)域中國會落后。
軟件的本質(zhì)是算法,算法的本質(zhì)是數(shù)學(xué)。
數(shù)學(xué)?嘿嘿嘿。中國人的數(shù)學(xué)已經(jīng)卷出地球了。
04
工業(yè)機(jī)器人,你知道我說的誰了嗎?
也就是說,高科技軟件的實質(zhì),要回到物理層面:機(jī)器、設(shè)備。
AI將要在一個領(lǐng)域掀起一場革命,那就是工業(yè)機(jī)器人。
中國最大的機(jī)器人上市公司是誰?
美的,因為它在2016年并購了庫卡集團(tuán),庫卡作為世界四大機(jī)器人巨頭之一,年銷售額已經(jīng)接近300億(2022年299億)。
2月,美的集團(tuán)宣布成為百度文心一言(英文名:ERNIE Bot)首批生態(tài)合作伙伴,攜手百度推進(jìn)智能家居領(lǐng)域人機(jī)對話能力的進(jìn)一步升級,通過前沿的生成式AI技術(shù),用戶有望實現(xiàn)智能家居場景下自然流利的對話。
美的集團(tuán)AI創(chuàng)新中心算法負(fù)責(zé)人介紹,接入百度文心一言能力后,美的智能家居、美的家庭服務(wù)機(jī)器人將可以優(yōu)先內(nèi)測和試用文心一言的諸多能力,這將明顯提升現(xiàn)有產(chǎn)品和服務(wù)的智能化水平。
整個流程,一下子打開了,豁然開朗。
一個人和機(jī)器和諧共存的未來,是不是很值得期待?
原文標(biāo)題 : 意料之外的AI硬件巨頭

最新活動更多
-
8月5日立即報名>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
-
8月14日立即報名>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
精彩回顧立即查看>> OFweek 2025 具身機(jī)器人動力電池技術(shù)應(yīng)用大會
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進(jìn)化