訂閱
糾錯(cuò)
加入自媒體

如何讓AI更合作更懂事?新研究:讓AI產(chǎn)生內(nèi)疚感

在AI快速發(fā)展的今天,一個(gè)關(guān)鍵問題始終揮之不去:我們該如何讓AI與人類真正站在同一戰(zhàn)線?

這個(gè)問題的背后,其實(shí)不是讓AI變聰明,而是讓它變“懂事”。

最近,一項(xiàng)刊登在《英國皇家學(xué)會(huì)·界面期刊》的研究提供了一個(gè)有趣的視角:

或許我們不需要教會(huì)AI所有的規(guī)則,只要讓它“感覺到自己做錯(cuò)了事”,也就是給它一種“內(nèi)疚感”,它就可能變得更合作、更可控。

聽起來像心理學(xué),其實(shí)是博弈論。 

1 內(nèi)疚,也許是調(diào)教AI的新鑰匙

人類之所以能夠建立社會(huì),不只是靠法律和制度,更多是靠一些深層的情感機(jī)制,比如羞恥、悔過、道德感。這些情緒會(huì)讓人自我約束,避免過于自私。

那AI如果也具備這種“自我約束”的能力,會(huì)發(fā)生什么?

研究團(tuán)隊(duì)為AI智能體構(gòu)建了一個(gè)“囚徒困境”游戲?qū)嶒?yàn)。在這個(gè)經(jīng)典的博弈框架中,每個(gè)智能體在每一輪都要選擇合作還是背叛,而最優(yōu)的群體結(jié)果其實(shí)取決于彼此的信任和長期策略。

為了測試“內(nèi)疚”的作用,研究者給這些AI加入了兩種機(jī)制:

社交型內(nèi)疚:只有當(dāng)AI知道對手也會(huì)對類似行為感到內(nèi)疚時(shí),它才會(huì)調(diào)整自己的行為。

非社交型內(nèi)疚:無論對方如何,只要自己偏離合作,它就會(huì)自動(dòng)產(chǎn)生修正行為。

這些AI還會(huì)根據(jù)自己的行為積分來“清算”自己的內(nèi)疚,比如如果背叛次數(shù)太多,它就會(huì)在下一輪放棄部分得分,以“彌補(bǔ)”過去的不合作。 

2 演化博弈:合作比你想象的更難,也更微妙

實(shí)驗(yàn)中,AI智能體之間會(huì)不斷地進(jìn)行博弈,而且它們還能學(xué)習(xí)彼此的策略,向得分更高的行為靠攏。這樣的設(shè)定,模擬了一個(gè)簡化版的演化過程。

結(jié)果很有意思:

擁有“社交型內(nèi)疚”的AI,更容易形成合作關(guān)系,整體表現(xiàn)更好;

“非社交型內(nèi)疚”雖然效果一般,但在某些特定的網(wǎng)絡(luò)結(jié)構(gòu)中,仍然能夠長期存活;

當(dāng)每個(gè)AI都能與所有人交互時(shí),非社交型機(jī)制會(huì)迅速被淘汰;

但如果是“局部結(jié)構(gòu)”——比如像朋友圈那樣的關(guān)系網(wǎng)——內(nèi)疚機(jī)制反而更加穩(wěn)定。

這說明,AI在更貼近人類社會(huì)結(jié)構(gòu)的環(huán)境下,確實(shí)可能通過“軟性約束”形成更協(xié)調(diào)的行為。 

3 那我們真的要給AI情緒嗎?

這項(xiàng)研究并不是要讓AI真正擁有情感,而是通過機(jī)制模擬出情緒產(chǎn)生的行為效果。

研究背后的核心觀點(diǎn)是:情緒并非無用的副產(chǎn)品,而是演化中形成的高效協(xié)調(diào)工具。如果AI未來也需要與人類、與其他AI密切協(xié)作,那么讓它“知道錯(cuò)”、“愿意改”或許比單純設(shè)定懲罰規(guī)則更有用。

而且這種機(jī)制本身可以量化、可控,比人類情緒穩(wěn)定得多。 

4 離現(xiàn)實(shí)還有多遠(yuǎn)?

當(dāng)前的實(shí)驗(yàn)仍處于非;A(chǔ)的階段,使用的是簡單的決策智能體系統(tǒng),還沒有在更加復(fù)雜的多模態(tài)AI上進(jìn)行驗(yàn)證。

但這個(gè)方向的潛力不容忽視。

畢竟,AI的能力正在迅速擴(kuò)張,從寫代碼、畫圖到生成視頻、管理組織,它們正在成為復(fù)雜社會(huì)的一部分。如果我們希望這些系統(tǒng)能夠融入人類環(huán)境,成為可靠的合作者而非潛在的威脅,就必須考慮不僅讓它“理解目標(biāo)”,更要讓它“理解后果”。

在這方面,內(nèi)疚感或許不是軟弱的象征,而是理性的延伸。

AI的發(fā)展,過去是讓它更聰明;現(xiàn)在是讓它更有邊界;而未來,可能是讓它更能反思。

我們當(dāng)然不指望AI變成圣人,但如果它能在關(guān)鍵時(shí)刻“退一步”,愿意從整體角度做選擇,那也許就是通往“可信AI”的一小步。

       原文標(biāo)題 : 如何讓AI更合作更懂事?新研究:讓AI產(chǎn)生內(nèi)疚感

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)