深度神經(jīng)網(wǎng)絡,為何備受關(guān)注?
深度神經(jīng)網(wǎng)絡是機器學習(ML, Machine Learning)領域中一種技術(shù)。
在監(jiān)督學習中,以前的多層神經(jīng)網(wǎng)絡的問題是容易陷入局部極值點。如果訓練樣本足夠充分覆蓋未來的樣本,那么學到的多層權(quán)重可以很好的用來預測新的測試樣本。但是很多任務難以得到足夠多的標記樣本,在這種情況下,簡單的模型,比如線性回歸或者決策樹往往能得到比多層神經(jīng)網(wǎng)絡更好的結(jié)果(更好的泛化性,更差的訓練誤差)。
非監(jiān)督學習中,以往沒有有效的方法構(gòu)造多層網(wǎng)絡。多層神經(jīng)網(wǎng)絡的頂層是底層特征的高級表示,比如底層是像素點,上一層的結(jié)點可能表示橫線,三角; 而頂層可能有一個結(jié)點表示人臉。一個成功的算法應該能讓生成的頂層特征最大化的代表底層的樣例。如果對所有層同時訓練,時間復雜度會太高; 如果每次訓練一層,偏差就會逐層傳遞。這會面臨跟上面監(jiān)督學習中相反的問題,會嚴重欠擬合。
2006年,hinton提出了在非監(jiān)督數(shù)據(jù)上建立多層神經(jīng)網(wǎng)絡的一個有效方法,簡單的說,分為兩步,一是每次訓練一層網(wǎng)絡,二是調(diào)優(yōu)使原始表示x向上生成的高級表示r和該高級表示r向下生成的x'盡可能一致。方法是
1,首先逐層構(gòu)建單層神經(jīng)元,這樣每次都是訓練一個單層網(wǎng)絡。
2,當所有層訓練完后,hinton使用wake-sleep算法進行調(diào)優(yōu)。將除最頂層的其它層間的權(quán)重變?yōu)殡p向的,這樣最頂層仍然是一個單層神經(jīng)網(wǎng)絡,而其它層則變?yōu)榱藞D模型。向上的權(quán)重用于”認知“,向下的權(quán)重用于”生成“。然后使用Wake-Sleep算法調(diào)整所有的權(quán)重。讓認知和生成達成一致,也就是保證生成的最頂層表示能夠盡可能正確的復原底層的結(jié)點。比如頂層的一個結(jié)點表示人臉,那么所有人臉的圖像應該激活這個結(jié)點,并且這個結(jié)果向下生成的圖像應該能夠表現(xiàn)為一個大概的人臉圖像。Wake-Sleep算法分為醒(wake)和睡(sleep)兩個部分。
2.1,wake階段,認知過程,通過外界的特征和向上的權(quán)重(認知權(quán)重)產(chǎn)生每一層的抽象表示(結(jié)點狀態(tài)),并且使用梯度下降修改層間的下行權(quán)重(生成權(quán)重)。也就是“如果現(xiàn)實跟我想像的不一樣,改變我的權(quán)重使得我想像的東西就是這樣的“。
2.2,sleep階段,生成過程,通過頂層表示(醒時學得的概念)和向下權(quán)重,生成底層的狀態(tài),同時修改層間向上的權(quán)重。也就是“如果夢中的景象不是我腦中的相應概念,改變我的認知權(quán)重使得這種景象在我看來就是這個概念“。
由于自動編碼器(auto-encoder,即上面說的神經(jīng)網(wǎng)絡。廣義上的自動編碼器指所有的從低級表示得到高級表示,并能從高級表示生成低級表示的近似的結(jié)構(gòu),狹義上指的是其中的一種,谷歌的人臉識別用的)有聯(lián)想功能,也就是缺失部分輸入也能得到正確的編碼,所以上面說的算法也可以用于有監(jiān)督學習,訓練時y做為頂層網(wǎng)絡輸入的補充,應用時頂層網(wǎng)絡生成y'。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機器人借殼上市,A股人形機器人第一股!
- 8 華為讓渡“三界”銷售主導權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進化