簡(jiǎn)單草圖也能瞬間生成真實(shí)人臉照?
人工智能的功能真的是越來(lái)越強(qiáng)大了。小黑前幾天剛剛介紹過(guò)可以寫文章的人工智能GPT-3,現(xiàn)在,又來(lái)了幾個(gè)可以畫畫的人工智能。
這些人工智能有的可以自動(dòng)生成人臉照片,有的可以讓人變成“迪士尼小公主”。具體情況,還是跟著小黑一起來(lái)看看吧。
讓簡(jiǎn)筆畫變成真人照片,人工智能是怎么做到的?
將3D物體繪制成平面圖片的人工智能算法已經(jīng)不算什么新鮮事了,而且實(shí)現(xiàn)原理也并不復(fù)雜:獲取3D模型輸入,并逐步細(xì)分,最后繪制出這一3D對(duì)象的平面圖像進(jìn)行輸出。
但是要將這些步驟反過(guò)來(lái),在平面圖片中生成逼真的圖像,是不是聽(tīng)起來(lái)有點(diǎn)像是科幻小說(shuō)中的情節(jié)?其實(shí),在一年半以前,英偉達(dá)的科學(xué)家就開(kāi)始使用這一算法了。
不過(guò),這個(gè)算法的局限性在于無(wú)法生成真實(shí)的人臉。
為了達(dá)到這一目標(biāo),科學(xué)家們做出了許多努力,但一般的AI算法都需要細(xì)節(jié)完善的圖片進(jìn)行處理,因此實(shí)用性和普及度都不夠高。
但是,這個(gè)問(wèn)題現(xiàn)在得到了最終解決:新的AI算法DeepFaceDrawing,可以幫助用戶從手繪簡(jiǎn)圖中深度生成面部圖像。
DeepFaceDrawing是一種基于深度學(xué)習(xí)的圖像-圖像轉(zhuǎn)換技術(shù)。這一技術(shù)可以幫助像小黑這樣的手殘黨畫出逼真的人像。
根據(jù)該團(tuán)隊(duì)的說(shuō)法,“我們的主要想法是從真實(shí)的面部素描圖像中隱式地學(xué)習(xí)一個(gè)合理的面部描寫空間,并在該空間中找到最接近的點(diǎn)來(lái)模擬該輸入草圖!
DeepFaceDrawing的深度學(xué)習(xí)框架由三個(gè)模塊組成,分別是CE(組件嵌入)、FM(特征映射)和IS(圖像合成)。CE模塊用來(lái)識(shí)別一些突出的面部特征,如眼睛、鼻子、嘴巴等,也包括面部剩余的部分。之后,由FM將這些特征映射到即將生成的人臉中,最后由IS生成完整的人臉。
不僅如此,它還可以識(shí)別用戶畫出的不同表情,并以此生成不同表情的人臉圖片。
除此之外,用戶還可以不畫任何物體,只通過(guò)選擇面部特征,就可以得到人臉圖片。這項(xiàng)技術(shù)被稱作“Face Copy-Paste”。
當(dāng)然,這項(xiàng)技術(shù)還有一些局限性,例如只能生成看上去“漂亮”的臉,但不可否認(rèn)的是,至少?gòu)男『诘慕嵌葋?lái)說(shuō),這項(xiàng)技術(shù)的實(shí)際運(yùn)用會(huì)相當(dāng)廣泛:
至少警察叔叔們?cè)谛枰L制人像的時(shí)候,可以先讓受害者繪制簡(jiǎn)單草圖,并稍作調(diào)整,就可以第一時(shí)間知道犯罪嫌疑人的大概長(zhǎng)相,而不必再等專門的模擬畫像專家上門了。要知道,模擬畫像專家可是非常稀有的呢。
通過(guò)照片,一鍵進(jìn)入迪士尼的世界
如果上面那個(gè)AI算法在現(xiàn)實(shí)中非常有用,那么接下來(lái)小黑要介紹的這個(gè)算法,則可以滿足每個(gè)孩子的“卡通夢(mèng)”。
這個(gè)算法的名字叫作Toonify Yourself。在介紹之前,小黑先放出幾張通過(guò)它制作的名人卡通頭像讓大家欣賞一下吧。
雖然小黑個(gè)人覺(jué)得,這個(gè)AI的實(shí)現(xiàn)方式并不困難,但它的火爆還是讓小黑吃驚:
根據(jù)Toonify Yourself開(kāi)發(fā)者的闡述,這個(gè)工具剛剛發(fā)布就完成了25萬(wàn)次服務(wù),甚至一度還因?yàn)閿D爆了服務(wù)器被迫下線。好在目前,這個(gè)工具已經(jīng)重新上線,感興趣的小伙伴們可以通過(guò)國(guó)外的搜索引擎搜索“Toonify Yourself”,來(lái)進(jìn)行體驗(yàn)。
根據(jù)開(kāi)發(fā)者之一的Doron Adler介紹,Toonify Yourself采用的是混合網(wǎng)絡(luò)(Blended Network)機(jī)制,這個(gè)機(jī)制雖然復(fù)雜,但整體工作流程與其他的人工智能是一樣的:首先,通過(guò)預(yù)訓(xùn)練模塊對(duì)數(shù)量龐大的數(shù)據(jù)學(xué)習(xí),之后再使用處理模塊進(jìn)行圖像的混合生成。
為了保證生成照片的漫畫效果,他們收集了迪士尼、皮克斯、夢(mèng)工廠等動(dòng)畫制作廠商的約300多張漫畫圖像作為學(xué)習(xí)數(shù)據(jù)集。
而在圖像處理模塊中,模型中的不同層會(huì)以不同方式影響人物的生成效果。低分辨率層決定頭部姿勢(shì)和人臉形狀,而高分辨率層則控制光線和紋理等細(xì)節(jié)。
Toonify Yourself使用的 Layer Swapping 腳本可以從原始圖片中提取高分辨率層,并從預(yù)訓(xùn)練模塊的微調(diào)模型中提取低分辨率層,最終得到具有卡通人臉結(jié)構(gòu),且和照片一樣逼真的混合模型。
或許在不久的將來(lái),Vlogger們不止可以拍出真人視頻,還可以通過(guò)這一技術(shù)拍出不遜于迪士尼大片的動(dòng)畫視頻來(lái)。
在人工智能越來(lái)越發(fā)達(dá)的現(xiàn)在,許多我們?cè)日J(rèn)為的復(fù)雜工作,都可以輕松解決。這就解放了許多人的生產(chǎn)力,也降低了不少工作的門檻。
小黑始終相信,人工智能可以讓我們?cè)谶M(jìn)行創(chuàng)作時(shí),有更輕松的工作方式。相信通過(guò)它的不斷發(fā)展,我們可以在最后真正擺脫那些繁瑣無(wú)用的工作,給每一個(gè)人的創(chuàng)意添上一雙翅膀。
圖源:網(wǎng)絡(luò)、官網(wǎng)

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
8月5日立即報(bào)名>> 【在線會(huì)議】CAE優(yōu)化設(shè)計(jì):醫(yī)療器械設(shè)計(jì)的應(yīng)用案例與方案解析
-
8月14日立即報(bào)名>> 【在線研討會(huì)】解析安森美(onsemi)高精度與超低功耗CGM系統(tǒng)解決方案
-
精彩回顧立即查看>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》
-
精彩回顧立即查看>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
精彩回顧立即查看>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
精彩回顧立即查看>> OFweek 2025 具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
推薦專題
- 1 AI產(chǎn)業(yè)的新高度!英偉達(dá)成為全球首家市值破4萬(wàn)億美元的公司
- 2 傳魏建軍與賈躍亭合作,長(zhǎng)城汽車出海美國(guó)
- 3 一文讀懂:到底什么是 “具身智能” ?
- 4 黃仁勛:與雷軍長(zhǎng)期合作,共探AI智駕
- 5 具身智能泡沫爭(zhēng)議下,華映資本尋找「穿越周期者」
- 6 中國(guó)平安們欲靠AI守“陣地”
- 7 官宣:智元機(jī)器人借殼上市,A股人形機(jī)器人第一股!
- 8 華為讓渡“三界”銷售主導(dǎo)權(quán),智界高管:終于能全力奔跑了
- 9 借仿生手實(shí)現(xiàn)突圍,國(guó)產(chǎn)靈巧手破局“不可能三角”
- 10 DeepSeek R2加持,中國(guó)AI與芯片產(chǎn)業(yè)迎來(lái)新一輪協(xié)同進(jìn)化