摘譯:認(rèn)知體系研究綜述|深蘭科技
作為人工智能的一個重要分支,認(rèn)知體系的研究和應(yīng)用經(jīng)過了近40年的發(fā)展,已取得了可見的成果。前兩期內(nèi)容對認(rèn)知體系的概念、感知和注意力進(jìn)行了介紹,本期將繼續(xù)分享關(guān)于行動選擇和記憶的部分。
一般來說,行動選擇決定在什么時間要做些什么,被分為“做什么”(即做什么決策)和“怎樣做”(即動作如何控制)。例如,在MIDAS體系,行動選擇包含了目標(biāo)任務(wù)和執(zhí)行這個選擇的動作或行動。同樣的,在MIDCA中,下一個動作通常是從一個被計劃好的序列中選擇出來的(如果這個序列存在的話)。因為在不同的認(rèn)知體系中,行動選擇的方法是不同的。在接下來的討論中,行動選擇機(jī)制可應(yīng)用于決策和動作。
圖1行動選擇所涉及的機(jī)制
圖1顯示了所有被執(zhí)行的行動選擇機(jī)制,根據(jù)相關(guān)的體系類型(符號、混合、涌現(xiàn))來組織。執(zhí)行行動選擇的主要兩種方式:計劃和動態(tài)。計劃是事先制定一系列的步驟以達(dá)到一個確定的目標(biāo)。在動態(tài)的行動選擇中,一個最好的動作是從其他方案中被選擇出來的,基于當(dāng)時可獲得的知識。對于這個類別,我們考慮選擇的類別(贏者通吃、概率、預(yù)定義)和選擇的標(biāo)準(zhǔn)(相關(guān)性、效用、感情)。默認(rèn)選項一直是基于給定的標(biāo)準(zhǔn)做出的最好的動作(有最高激活水平的動作)。
最后,學(xué)習(xí)也可以影響行動選擇,但會在第8節(jié)中討論。注意,這些行動選擇機(jī)制并不互相排斥并且大多數(shù)體系中有不止一種機(jī)制。盡管很少的體系會執(zhí)行同樣的行動選擇機(jī)制,可行的組合空間通常會很大。
圖1中可視化分為三列:符號、混合和涌現(xiàn)。注意,在這個圖中,排序順序強(qiáng)調(diào)具有相似動作的選擇機(jī)制(或分別為記憶和學(xué)習(xí)方法)的體系結(jié)構(gòu)簇。
1.1 計劃與反應(yīng)式動作
可以預(yù)見的是,計劃型行動選擇在符號范式體系中更加常見,但是也能在一些混合的甚至是涌現(xiàn)范式體系中被發(fā)現(xiàn)。尤其是在任務(wù)分解中,當(dāng)目標(biāo)被遞歸地分解成子目標(biāo),任務(wù)分解是計劃動作的一種非常常見的形式。
其他被使用的計劃動作的類型有:暫時性的、連續(xù)性的、層級性任務(wù)網(wǎng)絡(luò)的、生成式的、基于搜索的、局部擇優(yōu)的等等。在我們的選擇中,很少有體系僅僅只依賴于計劃,例如OSCAR做邏輯推理和IMPRINT使用任務(wù)分解來模擬人類行動。除此之外,計劃型行動選擇經(jīng)常利用加強(qiáng)動態(tài)的行動選擇機(jī)制,來提升對變化的環(huán)境的適應(yīng)性。
1.2 動態(tài)行動選擇
動態(tài)行動選擇能提供更多靈活性,并且能被用來模擬人類和動物!摆A者通吃”是神經(jīng)網(wǎng)絡(luò)中的一種選擇策略(最強(qiáng)的輸入被增強(qiáng)而其余的被抑制),它和它的變異體在各種新興體系中很常見。同樣的機(jī)制也被用來在所有體系中尋找最適合的動作,通常行動是多個并行過程的合作和競爭的結(jié)果。
行動選擇的預(yù)定義序(方式)可能服務(wù)于不同目的。比如,在Subsumption體系中,機(jī)器人行動被附屬行動等級所表示,高級行動優(yōu)先于(包含)低級行動的輸出。
在FORR中,做決策的部分根據(jù)遞增順序來從顧問中考慮選項,以達(dá)到與人類成員類似的學(xué)習(xí)。在YMIR中,優(yōu)先級首先被給與到反應(yīng)層中的過程中,然后是內(nèi)容層,再是過程控制層。這里,目的是提供一個平滑的實時行動生成。每層有一個不同的認(rèn)知反應(yīng)時間上限,因此,反應(yīng)式模塊為用戶提供自動的反饋(變化的臉部表情、自動發(fā)聲),而審議性模塊生成更復(fù)雜的行動。剩余的行動選擇機(jī)制包含有限狀態(tài)機(jī)制,被經(jīng)常用來表示動作的順序甚至來編譯整個系統(tǒng)的行動,概率行動選擇也常見。
行動選擇標(biāo)準(zhǔn)
在選擇下一個動作時,有多個標(biāo)準(zhǔn)要被考慮到:相關(guān)性、效用和感情(包括動機(jī)、情感狀態(tài)、情緒、心情、積極性等)。
相關(guān)性反映出動作有多么契合現(xiàn)在的情況,這主要應(yīng)用于有符號范式推理的系統(tǒng)和在應(yīng)用前測試規(guī)則前/后的條件。動作的效用是測量為了達(dá)到現(xiàn)有目標(biāo)的期望貢獻(xiàn)。一些體系也會執(zhí)行候選動作的“干運(yùn)行(dry run)”,并觀察他們的效果來決定他們的效用。效用也會考慮到過去動作的表現(xiàn)并在將來通過強(qiáng)化學(xué)習(xí)來促進(jìn)行動的成長。其他機(jī)器學(xué)習(xí)技術(shù)也可以被用來把過去的成功行動和目標(biāo)做關(guān)聯(lián)。最后,內(nèi)部因素并不直接決定下一個行動,但是會使選擇存在偏差。
簡單來說,我們會考慮關(guān)聯(lián)到情緒、積極性和人類個性特征的短期、長期和終身因素;谶@些因素對于人類的決策和其他認(rèn)知能力的影響,在認(rèn)知體系中模擬情緒和情感是重要的,特別在人機(jī)交互、社交機(jī)器人和虛擬代理的領(lǐng)域。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
8月5日立即報名>> 【在線會議】CAE優(yōu)化設(shè)計:醫(yī)療器械設(shè)計的應(yīng)用案例與方案解析
-
8月14日立即報名>> 【在線研討會】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
精彩回顧立即查看>> OFweek 2025 具身機(jī)器人動力電池技術(shù)應(yīng)用大會
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進(jìn)化