AI自畫像背后的功臣——詳解GAN

CFan 電腦愛好者 2020-03-24 10:01應用 標簽:技巧

CFan曾在《AI自畫像揭開智能創意冰山一角》一文中,介紹了AI使用GAN技術可以生成一幅以假亂真的圖片。那么GAN是怎么實現這些功能?今天就讓我們探索其中的秘密。

揭開迷霧——了解GAN

GAN是Generative Adversarial Networks的縮寫,譯為生成式對抗網絡,它是一種深度學習模型。大家知道要讓機器擁有人工智能,大量的學習是必不可少的,現在AI大多使用的是大數據+深度學習的模式,而要讓機器深度學習,模型是必不可少的要素。GAN主要由N、A、G組成(圖1)。

201901gng1

圖1 GAN圖解

N即Networks,深度神經網絡,AI通過神經網絡可以學習和自我學習,從而掌握很多高深的技術。

A即Adversarial:對抗,AI通過深度學習后成為“高手”,在模型系統中這個“高手”會和自己對弈,從而在互相對弈中提高技能。

G即Generative(Model):生成模型,通過神經網絡學習以及自我對弈,這樣即可生成模型,最終通過不斷完善模型和算法,讓AI擁有超凡的人工智能。

藝驚四座——GAN工作原理揭秘

通過上面的描述我們簡單了解了GAN的組成,那么在AI得實際運行中,GAN又是怎樣實現深度學習,讓AI擁有高超的人工智能得呢?

如上所述,GAN是由神經網絡、對抗和模型組成的,其中核心則是對抗。對抗模型也稱之為GAN框架,這個框架主要由生成模型G和判別模型D組成。在開始訓練的時候,系統會把真實樣本數據(X)隨機傳送一份給判別模型D,D的目標是盡可能正確識別出真實樣本(如果正確則輸出為“真”或者“1”)。同時用于識別得噪聲數據樣本(Z)也會隨機傳輸一份給生成模型G,G會將處理的數據也傳輸給D進行判別。這樣D既要判斷真實的數據(并盡可能識別為真),也要對噪聲數據進行識別(盡可能正確地揪出生成的樣本,也就是假樣本輸出為“假”,或者0)。在訓練過程中雙方都不斷優化自己,直到達到平衡,即假樣本與真樣本完全不可區分(圖2)。

201901gng2

圖2 GAN框架圖解

當然技術術語的解釋總是很晦澀,我們可以用足球運動來進行比喻。在GAN框架中,這里我們將生成模型G比喻球員的“假摔”,他們的目標是使用各種手段迷惑裁判,使得自己進攻或者防守戰術動作是合規的。比如球門前的假摔看上去像真的對方犯規一樣,判別模型則相當于裁判,他們目標是將球員各種混雜在合規戰術里的違規動作找出來。在球員和裁判的不斷對抗中,球員的“假摔”水平越來越高,裁判識別“假摔”水平也越來越高。隨著兩方水平的不斷提高,最終誰都無法區分出哪個動作是真正的“假摔”,也就是AI的水平已經實現以假亂真(圖3)。

201901gng3

圖3 比喻圖解

當然在實際的應用中,AI不是用來制作興奮劑,而是指其強大的自我糾錯和學習能力。借助GAN框架,AI可以擁有人類無法想象的超級能力。比如上一期介紹的自畫像,AI可以描繪出人類無法表達的畫面。在類似的場景中還有很多有趣應用,比如在很多廣告創意中,藝術家會投入很多時間設計在視覺上與其他元素的形狀和紋理相兼容的字形,但是這樣手工設計的字形是和當前場景緊密集成在一起的的,即使是同一幅畫面,如果要制作出同樣效果的字形,藝術家也不得不要重復勞動,因為根據目前的技術很難將它遷移到其他類似的項目中。

現在借助GAN的學習,AI可以很輕松學會并領會藝術家的意圖,它會先對畫面環境、光線、場景等進行學習,然后對字體在這畫面的各種情形進行讀取,并將字體的每個元素拆分學習,如字體的形態、顏色、手法等進行精密學習,從而精準復制出和海報場景非常契合的字形,并將這些原來很難遷移的字形進行任意的移植(圖4)。

201901gng4

圖4 字形在不同海報之間的遷移

突破限制——GAN給我們帶來更多

通過上述介紹可以看到,借助GAN框架學習,AI可以掌握甚至超過很多人類掌握的技能。AI的這些技術可以給我們生活帶來很多的便利。

比如GAN對字體超高的學習能力,它可以被用來學習生成各種各樣的字體,同樣可以用它來進行個人字體、字跡的辨別。這樣以后如果哪個老賴簽字卻否認是他簽名的文字,我們可能不要借助專業的鑒別機構就可以輕松進行鑒別了(圖5)。

201901gng5

圖5 GAN識別并生成各種字體

當然GAN還有很多應用,比如基于Age-cGAN開發的應用OLDIFY,可以合成你任意年齡之后或者之前的形態,只要有一張年輕時候的照片,你就可以提前知道自己幾十年之后,或者回憶十幾年之前的樣子,這是不是很有趣(圖6)。

201901gng6

圖6 OLDIFY的年齡合成

當然GAN框架在很多領域還有非常實用的應用,比如在醫學領域,GAN可以通過對復雜疾病的診斷學習,幫助醫生在以后的病例中快速對病人做出全面、科學的診斷。警察可以借助GAN從監控視頻中對分割圖還原成真實照片,將黑白圖變成彩色圖,對犯罪嫌疑人進行精準的識別,讓犯罪嫌疑人無處遁形,我們期待GAN給我們帶來更多的應用!

 

黑龙江快乐十分前三组开奖