實(shí)現(xiàn)人臉識(shí)別無(wú)感通行的密鑰:圖像質(zhì)量檢測(cè)算法
作為生物識(shí)別技術(shù)的一種,搭載人臉識(shí)別功能的各類智能化產(chǎn)品已應(yīng)用得非常普遍。但從產(chǎn)品體驗(yàn)而言,用戶的感受卻不盡相同。比如有能夠在自行車(chē)騎行狀態(tài)下,無(wú)需下車(chē)實(shí)現(xiàn)快速無(wú)感通行的小區(qū)人臉識(shí)別閘機(jī)。同時(shí)也會(huì)在使用部分產(chǎn)品時(shí),遇到多次識(shí)別不通過(guò)、站在原處不停變換人臉角度等待識(shí)別通過(guò)的尷尬。
造成這一差距,除了算法自身魯棒性和性能之外,由于模糊、遮擋、大角度、逆光暗光等復(fù)雜環(huán)境引起的人臉圖像質(zhì)量問(wèn)題也會(huì)導(dǎo)致人臉識(shí)別準(zhǔn)確率過(guò)低,需要多次重復(fù)識(shí)別才能成功,從而整體耗時(shí)被大大拉長(zhǎng)。
我們知道當(dāng)圖像質(zhì)量越差,那么人臉識(shí)別的準(zhǔn)確率就越低。如果可以將人臉圖像進(jìn)行標(biāo)準(zhǔn)化評(píng)估,去除低質(zhì)量圖片,將篩選后質(zhì)量符合標(biāo)準(zhǔn)的圖像才送往下一個(gè)流程中,那么識(shí)別效率將大大提升。這就是實(shí)現(xiàn)人臉識(shí)別無(wú)感通行的一項(xiàng)重要技術(shù)——圖像質(zhì)量檢測(cè)算法(FQ),《從零學(xué)習(xí)人臉識(shí)別》系列公開(kāi)課第六期就對(duì)該算法進(jìn)行了詳細(xì)介紹。
人臉圖像質(zhì)量檢測(cè)算法的原理
與人臉識(shí)別一樣,圖像質(zhì)量檢測(cè)算法(FQ)也是基于特征提取原理,通過(guò)神經(jīng)網(wǎng)絡(luò)從海量數(shù)據(jù)中學(xué)習(xí)獲取人臉質(zhì)量檢測(cè)關(guān)注的特征(主要包括光線、模糊、角度、遮擋、表情、噪聲等)并進(jìn)行質(zhì)量判斷。每個(gè)特征以特定的數(shù)值來(lái)表示,比如下圖的人臉特征向量為(0,1,0,1,1),即強(qiáng)光、中度模糊、中等遮擋、大角度、大表情。
當(dāng)然,這個(gè)特征向量可以無(wú)限擴(kuò)充,將特征的描述越細(xì)致,特征向量就越精確,光線可以增加暗光、低光,模糊可以增加輕微模糊、中等模糊。以虹軟視覺(jué)開(kāi)放平臺(tái)的圖像質(zhì)量檢測(cè)算法為例,在噪聲特征中甚至可以擴(kuò)充到六十四位以上的特征。
在提取特征向量后,各張人臉圖片的特征雜亂無(wú)序地分布在向量空間里。此時(shí),通過(guò)對(duì)數(shù)據(jù)進(jìn)行學(xué)習(xí),質(zhì)量好的樣本盡可能聚集在中間,而不好的被推離。最后根據(jù)計(jì)算樣本到圈中心的距離,得到一個(gè)質(zhì)量分?jǐn)?shù)。
每個(gè)特征對(duì)質(zhì)量分?jǐn)?shù)的影響各不相同,我們需要根據(jù)各自業(yè)務(wù)需求設(shè)定相應(yīng)的閾值,F(xiàn)Q會(huì)將低于設(shè)定閾值的低質(zhì)量圖像過(guò)濾,從而確保輸送到后面人臉識(shí)別環(huán)節(jié)的圖像質(zhì)量都是比較好的。
人臉圖像質(zhì)量檢測(cè)算法的經(jīng)典應(yīng)用
將人臉質(zhì)量檢測(cè)放到真實(shí)的使用場(chǎng)景中,情況會(huì)怎么樣?以下是基于,包含人臉檢測(cè)、活體檢測(cè)、人臉比對(duì)、人證比對(duì)等一系列功能在內(nèi)的虹軟視覺(jué)開(kāi)放平臺(tái)免費(fèi)、離線SDK ArcFace,所開(kāi)發(fā)的智能辦公刷臉門(mén)禁。
一名用戶從遠(yuǎn)處走來(lái),由于距離原因,系統(tǒng)首先捕捉到的是比較模糊的人臉圖像。而后,F(xiàn)Q算法會(huì)自動(dòng)進(jìn)行判斷,由于質(zhì)量過(guò)低該圖像會(huì)被拒絕送往下一個(gè)識(shí)別環(huán)節(jié)中。隨后系統(tǒng)會(huì)繼續(xù)捕捉,直到一張質(zhì)量較好的人臉圖像被送往識(shí)別并成功。整個(gè)過(guò)程用戶無(wú)需刻意停留等待,即可一次完成人臉識(shí)別。
而如果在沒(méi)有加入FQ算法的情況下,首次捕捉到的模糊照片被送入下一個(gè)人臉識(shí)別環(huán)節(jié)中。當(dāng)這張人臉圖片在識(shí)別失敗后,系統(tǒng)就需要再捕捉一張圖片,進(jìn)行第二次識(shí)別、甚至第三次識(shí)別。如此,用戶基本將難以實(shí)現(xiàn)無(wú)感快速通行。
從對(duì)比實(shí)驗(yàn)中,所感受到的差異就已經(jīng)非常明顯,如下圖所示:相比沒(méi)有FQ的情況,增加了FQ的人臉識(shí)別系統(tǒng)每個(gè)環(huán)節(jié)耗時(shí)平均減少約30%。
同樣,在批量進(jìn)行人臉識(shí)別底庫(kù)注冊(cè)時(shí),往往會(huì)有上萬(wàn)張圖片。普通的人工篩選,很難完成圖像質(zhì)量檢測(cè)。而FQ算法可以快速完成篩選,讓人臉識(shí)別從底庫(kù)的特征值開(kāi)始就更加準(zhǔn)確。
作為一款輔助算法,我們?cè)谶x型時(shí)要更多地考慮整體,F(xiàn)Q不能占用太大空間和耗時(shí)。比如上面“智能辦公刷臉門(mén)禁”實(shí)驗(yàn)中選擇的虹軟視覺(jué)開(kāi)放平臺(tái)所開(kāi)發(fā)的FQ算法,其模型小,能在確保精度的前提下盡可能提升檢測(cè)速度。
此外需要注意的是,不同項(xiàng)目、不同環(huán)境對(duì)質(zhì)量好的定義各有不同。比如公司刷臉門(mén)禁和絕密實(shí)驗(yàn)室的刷臉門(mén)禁,兩者對(duì)攝像頭成像效果的定義當(dāng)然就有所區(qū)別。這時(shí)候,開(kāi)發(fā)者就得根據(jù)不同項(xiàng)目需求進(jìn)行攝像頭的單獨(dú)調(diào)參,從而分支出不同場(chǎng)景的版本。
其他關(guān)于人臉質(zhì)量檢測(cè)的相關(guān)問(wèn)題, 第六期“虹軟視覺(jué)開(kāi)放平臺(tái)人臉公開(kāi)課”都有具體解答,感興趣的開(kāi)發(fā)者朋友可以點(diǎn)擊下方鏈接觀看完整視頻。或者自行搜索“虹軟視覺(jué)開(kāi)放平臺(tái)人臉公開(kāi)課”,隨時(shí)可以學(xué)習(xí)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
8月14日立即報(bào)名>> 【在線研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
精彩回顧立即查看>> OFweek 2025 具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬(wàn)億美元的公司
- 2 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車(chē)出海美國(guó)
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 5 具身智能泡沫爭(zhēng)議下,華映資本尋找「穿越周期者」
- 6 中國(guó)平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實(shí)現(xiàn)突圍,國(guó)產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來(lái)新一輪協(xié)同進(jìn)化