Facebook首次開(kāi)源超級(jí)圍棋AI,復(fù)現(xiàn)AI高手AlphaZero
最近,F(xiàn)acebook的人工智能研究所(以下簡(jiǎn)稱(chēng)FAIR)宣布,他們開(kāi)源了自研的圍棋AI訓(xùn)練模型和代碼。這意味著,你可以隨時(shí)隨地和Facebook的人工智能下圍棋了,而且此圍棋AI程序重現(xiàn)的是名噪一時(shí)的AI高手AlphaZero。
去年5月,F(xiàn)AIR發(fā)布了ELF Open GO,ELF OpenGo是FAIR依照DeepMind在《自然》上發(fā)表的和AlphaGo Zero以及AlphaZero相關(guān)的論文,做出的開(kāi)源計(jì)算機(jī)圍棋程序,也就是說(shuō),ELF OpenGo不使用人類(lèi)棋譜與累積的圍棋知識(shí),僅使用單一類(lèi)神經(jīng)網(wǎng)絡(luò)從自我對(duì)弈中學(xué)習(xí)。
該圍棋AI之前在和韓國(guó)棋院的專(zhuān)業(yè)圍棋選手對(duì)弈中,都取得不錯(cuò)的成績(jī)。據(jù)悉,OpenGo 的最新版本使用2000塊GPU訓(xùn)練了15天后,在一塊GPU的情況下與4個(gè)排名前30的職業(yè)選手進(jìn)行比賽時(shí),取得了20:0全勝的戰(zhàn)績(jī),可謂是戰(zhàn)無(wú)不勝。
在這次開(kāi)源的論文中,F(xiàn)AIR研究人員全面披露了ELF OpenGo的訓(xùn)練過(guò)程,包括取得的是三個(gè)突破。
一是為ELF OpenGo訓(xùn)練了一個(gè)超人類(lèi)棋藝的模型,他們?cè)?000個(gè)GPU上運(yùn)行類(lèi)AlphaZero的訓(xùn)練軟件9天后,有20個(gè)模塊的模型超越了人類(lèi)水平。
二是提供了模型在訓(xùn)練過(guò)程中的行為分析,包括和其他模型的對(duì)比、學(xué)習(xí)速度、學(xué)習(xí)難度等等。
三是通過(guò)實(shí)施ablation實(shí)驗(yàn),以研究AlphaZero風(fēng)格算法的性質(zhì),他們發(fā)現(xiàn)對(duì)于最終模型而言,對(duì)局中加倍rollout水平大約提升200 ELO,AI的發(fā)揮會(huì)受到模型容量的限制。
最后,此次論文的主要作者為田淵棟,他一直負(fù)責(zé)Facebook的圍棋AI相關(guān)研究,在此前的一篇知乎文章中,他提到:DeepMind不開(kāi)源也不透露細(xì)節(jié),文章里面一些地方也沒(méi)有寫(xiě)得很清楚。沒(méi)有第一手經(jīng)驗(yàn)總不是很踏實(shí)。所以本著研究目的,我們需要復(fù)現(xiàn)一下,先有復(fù)現(xiàn),才有創(chuàng)新,這個(gè)是做研究的習(xí)慣。而且如果我們?nèi)タ?ELF OpenGo 的代碼,會(huì)發(fā)現(xiàn)其完全適用于其它方向的工作。而圍棋對(duì)我們來(lái)說(shuō),只是一個(gè)把算法和平臺(tái)做好的手段。在這一點(diǎn)上,花點(diǎn)時(shí)間把圍棋做好是值得的。
最后,關(guān)于ELF OpenGo最新訓(xùn)練模型的具體數(shù)據(jù)可以閱讀原文獲取論文鏈接了解。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
8月14日立即報(bào)名>> 【在線研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
精彩回顧立即查看>> OFweek 2025 具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專(zhuān)題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬(wàn)億美元的公司
- 2 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車(chē)出海美國(guó)
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 5 具身智能泡沫爭(zhēng)議下,華映資本尋找「穿越周期者」
- 6 中國(guó)平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷(xiāo)售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實(shí)現(xiàn)突圍,國(guó)產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來(lái)新一輪協(xié)同進(jìn)化