訂閱
糾錯(cuò)
加入自媒體

生成式AI來了,我們還能夠相信自己的眼睛嗎?

有句老話叫做“眼見為實(shí)”,然而AI技術(shù)的迅猛發(fā)展正在改變這一切,我們可能很快就不再知道如何判斷什么是真的,什么是假的。
先來考考大家的眼力。

你覺得下圖中這位金發(fā)碧眼、面帶笑容的女士是真實(shí)存在的嗎?

答案是No,這是由人工智能合成的。 再看一張圖。你覺得下圖中這位女士像是人工智能合成的嗎?

答案是Yes。 上述這兩張圖均來自“ThisPersonDoesNotExist.com”網(wǎng)站。 不止這兩張圖片,“ThisPersonDoesNotExist.com”網(wǎng)站中,每次刷新出來的人物,都是現(xiàn)實(shí)中根本不存在的。 如果不知道真相,你是否根本無法判斷出真假? 這便是生成式AI的一種應(yīng)用。

 生成式AI:未來的重要技術(shù)戰(zhàn)略 日前,Gartner發(fā)布了2022年重要戰(zhàn)略技術(shù)趨勢(shì)。其中,生成式人工智能(Generative Artificial Intelligence)位列12項(xiàng)重要戰(zhàn)略之首。

同時(shí)Gartner預(yù)計(jì),到2025年,生成式人工智能將占所有生成數(shù)據(jù)的10%,而目前這一比例還不到1%。 對(duì)于生成式AI,Gartner這樣定義:通過各種機(jī)器學(xué)習(xí)(ML)方法從數(shù)據(jù)中學(xué)習(xí)工件的組件(要素),進(jìn)而生成全新的、完全原創(chuàng)的、真實(shí)的工件(一個(gè)產(chǎn)品或物品或任務(wù)),這些工件與訓(xùn)練數(shù)據(jù)保持相似,而不是復(fù)制。 簡(jiǎn)單來說,生成式AI從數(shù)據(jù)中學(xué)習(xí)內(nèi)容或?qū)ο螅⑦\(yùn)用數(shù)據(jù)生成全新、完全原創(chuàng)的新內(nèi)容,可以服務(wù)于下一代的自動(dòng)編程、藥物開發(fā)、視覺藝術(shù)、社交、商業(yè)服務(wù)、工程設(shè)計(jì)與流程。

同時(shí),它可以被用來檢測(cè)欺詐、虛假信息和身份盜竊。 對(duì)此,市場(chǎng)調(diào)研機(jī)構(gòu)Gartner高級(jí)研究總監(jiān)高挺解釋,生成式AI不僅僅可以判斷、還可以創(chuàng)造,實(shí)際上AI當(dāng)前最大的用途就是判斷,意味著AI的用途將有結(jié)構(gòu)性變化。 “以前我們是讓AI不停的去做判斷、去做分類。但是在未來,很多時(shí)候是需要AI不再去進(jìn)行判斷,而是說‘來幫我生成一段代碼’,這個(gè)代碼所做的事情是從1到100,AI也能自動(dòng)生成這個(gè)代碼了!

    生成式AI的關(guān)鍵技術(shù):GANs 回到文章開頭,AI到底是如何生成肉眼識(shí)別不出的人臉圖片呢? 這就不得不談到生成式AI的關(guān)鍵技術(shù)——生成式對(duì)抗網(wǎng)絡(luò)(GANs, Generative Adversarial Networks ),這是近年來復(fù)雜分布上無監(jiān)督學(xué)習(xí)最具前景的方法之一,其本質(zhì)是一種深度學(xué)習(xí)模型。 2014年,研究人員首次使用計(jì)算機(jī),利用生成對(duì)抗網(wǎng)絡(luò)GANs,創(chuàng)造出了逼真的人臉。 在原理上,生成式對(duì)抗網(wǎng)絡(luò)使用兩個(gè)神經(jīng)網(wǎng)絡(luò)相互對(duì)立,一個(gè)生成器和一個(gè)判別器。

生成器或生成網(wǎng)絡(luò)是一個(gè)神經(jīng)網(wǎng)絡(luò),負(fù)責(zé)生成類似于源數(shù)據(jù)的新數(shù)據(jù)或內(nèi)容。判別器或判別網(wǎng)絡(luò)是負(fù)責(zé)區(qū)分源數(shù)據(jù)和生成數(shù)據(jù)之間的神經(jīng)網(wǎng)絡(luò)。 這兩個(gè)神經(jīng)網(wǎng)絡(luò)都經(jīng)過交替周期訓(xùn)練,生成器不斷學(xué)習(xí)生成更逼真的數(shù)據(jù),判別器則更善于區(qū)分假數(shù)據(jù)和真實(shí)數(shù)據(jù)。 可以把GANs想象成一個(gè)造假者,一個(gè)在貓捉老鼠游戲中的警察,造假者正在學(xué)習(xí)傳遞假幣,而警察正在學(xué)習(xí)檢測(cè)假幣。漸漸地,雙方在對(duì)抗中都不斷完善。

生成式AI應(yīng)用遍地開花 生成式AI的到來,推動(dòng)了多個(gè)領(lǐng)域的數(shù)字化進(jìn)程,支撐著下一代的自動(dòng)編程、內(nèi)容開發(fā)、視覺藝術(shù)、社交、商業(yè)服務(wù)、工程設(shè)計(jì)與流程等。 2019年,F(xiàn)acebook AI創(chuàng)建了一個(gè)能夠從存量視頻中提取可控角色的系統(tǒng)。

利用該系統(tǒng),可以從日常視頻中任意創(chuàng)建虛擬人物及各種姿勢(shì)動(dòng)作,可以將一個(gè)視頻中的真人轉(zhuǎn)換成一個(gè) 3D角色,并且可以將此角色及其相關(guān)動(dòng)作轉(zhuǎn)換到新背景上,生成的角色可以和不同的背景互動(dòng)。 

2020年5月,OpenAI發(fā)布GPT-3,引起業(yè)界轟動(dòng),這個(gè)模型包含1750億個(gè)參數(shù),能夠自主生產(chǎn)文本、圖像、視頻,可以自己寫對(duì)話和電影情節(jié),幾乎分辨不出哪個(gè)是真人書寫,哪個(gè)是機(jī)器書寫,甚至生成式音樂也取得了很快的進(jìn)展。 

追溯到更早時(shí)間,中國(guó)AI公司影譜科技在2018年底發(fā)布MAGC智能影像生成引擎,這也是中國(guó)區(qū)最早提出的生成式AI的技術(shù)框架,并重新定義智能影像生產(chǎn)技術(shù)。 

影譜科技MAGC智能影像生成引擎可以在極短時(shí)間內(nèi)生成一段個(gè)性化視頻內(nèi)容,亦可以對(duì)拍攝視頻進(jìn)行重構(gòu),如自動(dòng)錨定關(guān)鍵幀,根據(jù)幀內(nèi)容生成原圖像中沒有的、無違和感的內(nèi)容,再智能化生成一段AI視覺內(nèi)容。 

目前,影譜科技MAGC智能影像生成引擎已率先應(yīng)用在傳媒娛樂領(lǐng)域,被知名電視臺(tái)、電信運(yùn)營(yíng)商、短視頻平臺(tái)廣泛采納。

除此之外,MAGC還廣泛應(yīng)用于數(shù)字人的3D成像、影視特效制作及數(shù)字孿生、虛擬主播、虛擬課堂等數(shù)字產(chǎn)權(quán)場(chǎng)景。 《Forrester 2019-2020年Video AI技術(shù)預(yù)測(cè)》報(bào)告顯示,智能影像生產(chǎn)技術(shù)解決了大規(guī)模視頻內(nèi)容制作和特效制作成本高的問題。

使用智能視頻技術(shù)平臺(tái),可提高視頻內(nèi)容的生產(chǎn)效率,降低人工成本60%以上。 此外,包括迪士尼、NETFLIX、HBO、TRONC等娛樂傳媒巨頭均在嘗試用人工智能代替標(biāo)準(zhǔn)內(nèi)容制作的可能。 例如,迪士尼實(shí)現(xiàn)AI自動(dòng)生成動(dòng)畫,只要通過文本描述某些活動(dòng),不需要注釋數(shù)據(jù)和進(jìn)行大量訓(xùn)練就能創(chuàng)建動(dòng)畫,或一個(gè)粗略的故事版和電影劇本視頻。

而Netflix所采用的算法,則可以在這部?jī)?nèi)容中抽取任意符合觀影習(xí)慣和需求的畫面,然后把這些圖片制作成內(nèi)容的封面。
事實(shí)上,降低了內(nèi)容搜尋難度,提升視頻制作效率,生成式AI已經(jīng)初步證明了自身技術(shù)與產(chǎn)品的商業(yè)價(jià)值。 2020年9月上市的Unity是3D生成型AI的推動(dòng)者。

全球有超過一半的移動(dòng)、PC和主機(jī)游戲采用了其生成引擎來制作,其3D-AI技術(shù)也廣泛應(yīng)用于工業(yè)設(shè)計(jì)的3D模型搭建,VR/AR設(shè)備內(nèi)容創(chuàng)作以及影視特效制作。 一家名為Insilico Medicine(英科智能)的AI藥物研發(fā)公司也是生成式AI的應(yīng)用者。

該公司是一家抗衰老及癌癥治療藥物研發(fā)商。2015年,Insilico Medicine在全球范圍內(nèi)率先利用生成對(duì)抗網(wǎng)絡(luò)(GANs)和強(qiáng)化學(xué)習(xí)(RL)技術(shù),生成具有特定性質(zhì)的藥物分子結(jié)構(gòu)。 從應(yīng)用場(chǎng)景可以看到,生成式AI技術(shù)正在快速迭代進(jìn)化,從“生產(chǎn)”出發(fā),擴(kuò)展至全產(chǎn)業(yè)鏈。

謹(jǐn)防生成式AI的濫用 既然生成式AI可以生成逼真的視頻、文本、字幕等,這也意味著,該技術(shù)也會(huì)被濫用于詐騙、欺詐、造謠、偽造身份等違法場(chǎng)景。 Gartner預(yù)測(cè):“可以創(chuàng)建和生成超逼真的內(nèi)容的AI能力,將對(duì)人們相信自己的眼睛所看到的產(chǎn)生變革性的影響! 同時(shí),Gartner從AI市場(chǎng)的5個(gè)角度進(jìn)行了預(yù)測(cè),并就企業(yè)如何應(yīng)對(duì)和適應(yīng)這些未來的挑戰(zhàn)提出了建議:

到2025年,預(yù)先訓(xùn)練的AI模型將主要集中在1%的供應(yīng)商中,這將使AI的負(fù)責(zé)任地使用成為社會(huì)關(guān)注的問題

在2023年,成功的賬戶接管攻擊將有20%使用Deepfake,它將會(huì)成為社會(huì)工程學(xué)攻擊的一部分

到2024年,將有60%的AI提供商會(huì)將緩解危害/濫用行為作為其軟件的一部分

到2025年,將有10%的政府通過使用合成AI來避免隱私和安全問題

到2025年,工作場(chǎng)所75%的對(duì)話將被記錄和分析,以用于增加組織價(jià)值和評(píng)估風(fēng)險(xiǎn)

這些分析中的每一個(gè)都足以使AI觀察者引起足夠的關(guān)注,如果將這些預(yù)測(cè)結(jié)合起來時(shí),就可以勾勒出未來的嚴(yán)峻形勢(shì),其中涉及道德問題,潛在的AI濫用以及工作場(chǎng)所隱私的喪失。 如果Gartner的分析師的預(yù)測(cè)準(zhǔn)確無誤,那么關(guān)于AI帶來的隱私和真相的影響的擔(dān)憂必將成為未來幾年的主要話題,成功的企業(yè)將需要準(zhǔn)備迅速適應(yīng)這些擔(dān)憂。 Gartner建議企業(yè)建立負(fù)責(zé)任的AI使用標(biāo)準(zhǔn),并優(yōu)先考慮“可以證明AI能夠清晰發(fā)展和解決相關(guān)社會(huì)問題”的供應(yīng)商。 圍繞Deepfake和生成式AI的安全問題,Gartner建議組織安排有關(guān)Deepfake的培訓(xùn),并指出:“我們現(xiàn)在正在進(jìn)入零信任的世界。

除非使用加密的數(shù)字簽名證明它是經(jīng)過認(rèn)證的,否則任何事物都不能被信任!

結(jié)語(yǔ)

過去言“有圖有真相”,但是現(xiàn)在視頻都不一定代表著真相。生成式AI技術(shù)一方面在多種場(chǎng)景得到了應(yīng)用,但另一方面也有著被濫用的風(fēng)險(xiǎn)。 未來,在深度偽造與鑒別偽造之間,一場(chǎng)技術(shù)博弈即將展開

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)