中文字幕无码无卡视频,久久99热狠狠色av蜜臀

更復(fù)雜的體系結(jié)構(gòu)能保證更好的模型嗎？

2022-04-19 14:46

磐創(chuàng)AI

關(guān)注

使用的數(shù)據(jù)集和數(shù)據(jù)預(yù)處理

我們將使用Kaggle的狗與貓數(shù)據(jù)集。它是根據(jù)知識(shí)共享許可證授權(quán)的，這意味著你可以免費(fèi)使用它：

該數(shù)據(jù)集相當(dāng)大——25000張圖像均勻分布在不同的類(lèi)中（12500張狗圖像和12500張貓圖像）。它應(yīng)該足夠大，以訓(xùn)練一個(gè)像樣的圖像分類(lèi)器。

你還應(yīng)該刪除train／cat／666．jpg和train／dog／11702．jpg圖像，這些已經(jīng)損壞，你的模型將無(wú)法使用它們進(jìn)行訓(xùn)練。

接下來(lái)，讓我們看看如何使用TensorFlow加載圖像。

如何使用TensorFlow加載圖像數(shù)據(jù)

今天你將看到的模型將比前幾篇文章中的模型具有更多的層。

為了可讀性，我們將從TensorFlow中導(dǎo)入單個(gè)類(lèi)。如果你正在跟進(jìn)，請(qǐng)確保有一個(gè)帶有GPU的系統(tǒng)，或者至少使用Google Colab。

讓我們把庫(kù)的導(dǎo)入放在一邊：

這是很多，但模型會(huì)因此看起來(lái)格外干凈。

我們現(xiàn)在將像往常一樣加載圖像數(shù)據(jù)——使用ImageDataGenerator類(lèi)。

我們將把圖像矩陣轉(zhuǎn)換為0–1范圍，使用用三個(gè)顏色通道，將所有圖像調(diào)整為224x224。出于內(nèi)存方面的考慮，我們將barch大小降低到32：

以下是你應(yīng)該看到的輸出：

讓我們鼓搗第一個(gè)模型！

向TensorFlow模型中添加層會(huì)有什么不同嗎？

從頭開(kāi)始編寫(xiě)卷積模型總是一項(xiàng)棘手的任務(wù)。網(wǎng)格搜索最優(yōu)架構(gòu)是不可行的，因?yàn)榫矸e模型需要很長(zhǎng)時(shí)間來(lái)訓(xùn)練，而且有太多的參數(shù)需要檢查。實(shí)際上，你更有可能使用遷移學(xué)習(xí)。這是我們將在不久的將來(lái)探討的主題。

今天，這一切都是為了理解為什么在模型架構(gòu)上大刀闊斧是不值得的。我們用一個(gè)簡(jiǎn)單的模型獲得了75％的準(zhǔn)確率，所以這是我們必須超越的基線(xiàn)。

模型1－兩個(gè)卷積塊

我們將宣布第一個(gè)模型在某種程度上類(lèi)似于VGG體系結(jié)構(gòu)——兩個(gè)卷積層，后面是一個(gè)池層。濾波器設(shè)置如下，第一個(gè)塊32個(gè)，第二個(gè)塊64個(gè)。

至于損失和優(yōu)化器，我們將堅(jiān)持基本原則——分類(lèi)交叉熵和Adam。數(shù)據(jù)集中的類(lèi)是完全平衡的，這意味著我們只需跟蹤準(zhǔn)確率即可：

model＿1 ＝ tf．keras．Sequential（［

Conv2D（filters＝32， kernel＿size＝（3， 3）， input＿shape＝（224， 224， 3）， activation＝＇relu＇），

Conv2D（filters＝32， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Conv2D（filters＝64， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Flatten（），

Dense（units＝128， activation＝＇relu＇），

Dense（units＝2， activation＝＇softmax＇）

］）

model＿1．compile（

loss＝categorical＿crossentropy，

optimizer＝Adam（），

metrics＝［BinaryAccuracy（name＝＇accuracy＇）］

）

model＿1＿h(yuǎn)istory ＝ model＿1．fit（

train＿data，

validation＿data＝valid＿data，

epochs＝10

）

以下是經(jīng)過(guò)10個(gè)epoch后的訓(xùn)練結(jié)果：

看起來(lái)我們的表現(xiàn)并沒(méi)有超過(guò)基線(xiàn)，因?yàn)轵?yàn)證準(zhǔn)確率仍然在75％左右。如果我們?cè)偌由弦粋€(gè)卷積塊會(huì)發(fā)生什么？

模型2－三個(gè)卷積塊

我們將保持模型體系結(jié)構(gòu)相同，唯一的區(qū)別是增加了一個(gè)包含128個(gè)濾波器的卷積塊：

model＿2 ＝ Sequential（［

Conv2D（filters＝32， kernel＿size＝（3， 3）， input＿shape＝（224， 224， 3）， activation＝＇relu＇），

Conv2D（filters＝32， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Conv2D（filters＝64， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Conv2D（filters＝128， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Flatten（），

Dense（units＝128， activation＝＇relu＇），

Dense（units＝2， activation＝＇softmax＇）

］）

model＿2．compile（

loss＝categorical＿crossentropy，

optimizer＝Adam（），

metrics＝［BinaryAccuracy（name＝＇accuracy＇）］

）

model＿2＿h(yuǎn)istory ＝ model＿2．fit（

train＿data，

validation＿data＝valid＿data，

epochs＝10

）

日志如下：

效果變差了。雖然你可以隨意調(diào)整batch大小和學(xué)習(xí)率，但效果可能仍然不行。第一個(gè)架構(gòu)在我們的數(shù)據(jù)集上工作得更好，所以讓我們?cè)囍^續(xù)調(diào)整一下。

模型3－帶Dropout的卷積塊

第三個(gè)模型的架構(gòu)與第一個(gè)模型相同，唯一的區(qū)別是增加了一個(gè)全連接層和一個(gè)Dropout層。讓我們看看這是否會(huì)有所不同：

model＿3 ＝ tf．keras．Sequential（［

Conv2D（filters＝32， kernel＿size＝（3， 3）， input＿shape＝（224， 224， 3）， activation＝＇relu＇），

Conv2D（filters＝32， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Conv2D（filters＝64， kernel＿size＝（3， 3）， activation＝＇relu＇），

MaxPool2D（pool＿size＝（2， 2）， padding＝＇same＇），

Flatten（），

Dense（units＝512， activation＝＇relu＇），

Dropout（rate＝0．3），

Dense（units＝128），

Dense（units＝2， activation＝＇softmax＇）

］）

model＿3．compile（

loss＝categorical＿crossentropy，

optimizer＝Adam（），

metrics＝［BinaryAccuracy（name＝＇accuracy＇）］

）

model＿3＿h(yuǎn)istory ＝ model＿3．fit（

train＿data，

validation＿data＝valid＿data，

epochs＝10

）

以下是訓(xùn)練日志：

太可怕了，現(xiàn)在還不到70％！上一篇文章中的簡(jiǎn)單架構(gòu)非常好。反而是數(shù)據(jù)質(zhì)量問(wèn)題限制了模型的預(yù)測(cè)能力。

結(jié)論

這就證明了，更復(fù)雜的模型體系結(jié)構(gòu)并不一定會(huì)產(chǎn)生性能更好的模型。也許你可以找到一個(gè)更適合貓狗數(shù)據(jù)集的架構(gòu)，但這可能是徒勞的。

你應(yīng)該將重點(diǎn)轉(zhuǎn)移到提高數(shù)據(jù)集質(zhì)量上。當(dāng)然，有20K個(gè)訓(xùn)練圖像，但我們?nèi)匀豢梢栽黾佣鄻有�。這就是數(shù)據(jù)增強(qiáng)的用武之地。

感謝閱讀！

原文標(biāo)題 : 更復(fù)雜的體系結(jié)構(gòu)能保證更好的模型嗎？

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫(xiě)，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪(fǎng)問(wèn)所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無(wú)評(píng)論

圖片新聞