CVPR2020|深蘭科技挑戰(zhàn)復雜場景,獲霧天條件目標檢測挑戰(zhàn)賽冠軍
03賽題特點&主要工作
在這次挑戰(zhàn)賽中,主要的難點包含以下幾個方面:
1.可視條件差、圖像模糊
可視條件差是這個賽道核心問題,霧天收集的數(shù)據(jù)特點就是能見度低,圖像模糊,遠處的物體不容易被檢測與識別,容易造成大量的目標漏檢、誤檢,從而導致mAP效果下降。
2.圖片數(shù)量少,數(shù)據(jù)分布不平衡
總共只有4000多張帶標注的圖片,增加了訓練難度,再加上數(shù)據(jù)分布的不均衡,很難劃分一個具有代表性的驗證集,很可能導致模型不具有泛化能力,在新的測試集上表現(xiàn)會不如預期。
檢測器
我們先通過常規(guī)檢測所累積的經(jīng)驗構(gòu)造出一個baseline:
Baseline=Backbone+DCN[1]+FPN[2]+CascadeRCNN[3]
這套pipeline,也是去年冠軍團隊所使用的方法,在這里我們沿用這套算法,以此為基礎(chǔ)進行改進。
通過觀察實驗結(jié)果發(fā)現(xiàn),模型誤檢情況遠多于漏檢,經(jīng)常出現(xiàn)一個目標有多個檢測結(jié)果,并且這些檢測結(jié)果之間無法使用nms去除。歸納為兩方面原因。
1.模型自身能力不足,回歸分類能力差,導致大量誤檢;
2.負樣本不足,由于樣本個數(shù)限制,模型會在一些模棱兩可的地方檢測出置信度較高的結(jié)果,無法通過閾值去處理這些誤檢結(jié)果。
根據(jù)目前結(jié)果做了一下幾個方面的改進:
1.DoubleHeads[6]
當需要提升模型能力時,有2個比較簡單高效的方法,一是使用更強的backbone,二是提高RCNN中分類檢測head的能力,通過實驗比對,我們最終使用了doublehead的結(jié)構(gòu)(如下圖所示)。
▲DoubleHeads
Doublehead采用分而治之的思想,將原始head解耦為2個獨立的分支,針對不同的需求設計head結(jié)構(gòu),通過對比實驗可發(fā)現(xiàn):使用FC-h(huán)ead做分類,Conv-h(huán)ead做回歸,可以得到最好的效果。
因為分類更多地需要語義信息,所以使用全連接層。而坐標框回歸需要更多的空間信息,因此使用卷積層。當然這種方法會增加計算量。在平衡速度和準確率的情況下,最終我們選擇了3個殘差2個Non-local共5個模塊。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達成為全球首家市值破4萬億美元的公司
- 2 傳魏建軍與賈躍亭合作,長城汽車出海美國
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長期合作,共探AI智駕
- 5 具身智能泡沫爭議下,華映資本尋找「穿越周期者」
- 6 中國平安們欲靠AI守“陣地”
- 7 官宣:智元機器人借殼上市,A股人形機器人第一股!
- 8 華為讓渡“三界”銷售主導權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實現(xiàn)突圍,國產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國AI與芯片產(chǎn)業(yè)迎來新一輪協(xié)同進化