重建模糊,低分辨率人臉圖像的正經 AI,被人用表情包玩壞了_風聞
高老庄朱刚烈-“于是我们继续奋力向前,逆水行舟。”2019-09-06 16:58
文章來源丨愛範兒
《恐襲波士頓》這部根據真實情況改編的電影有這樣一個情節,警察在波士頓爆炸案發生後開始瀏覽各種各樣的監控錄像,意圖找出那個行為異於常人的嫌疑人。
在監控錄像中,爆炸發生時有一個人把頭轉向了相反的方向,警方因此鎖定了犯罪嫌疑人。

▲ 電影裏的技術總是很高端. 圖片來自:《碟中諜 4》
在電影中,警察或許只需要對控制監控的操作員説「放大,再放大!」屏幕就能清晰地呈現嫌疑人的大臉,旁邊還配上他的生平年月、家庭情況、現居住址……
現實情況就很一言難盡了,誰知道錄下嫌疑人的監控攝像頭是幾年前裝的呢?這時候如果你只會説「放大,再放大!」那你估計就只能看到一個色彩均勻的像素塊了。想只憑借監控就鎖定犯罪嫌疑人,就目前的硬件條件而言還太難了。

▲ 圖片來自:《恐襲波士頓》
硬件跟不上,那軟件呢?最近,研究人員就展示了 AI 可能為此作出怎樣的貢獻,它或許可以幫助我們在不失真的情況下恢復人臉的基本特徵。
研究人員通過 AI 可以重建模糊、低分辨率的人臉圖像,使之更清晰、分辨率更高,更接近於真實的人臉。這一進展來自於人工智能研究的一個領域,被稱為「人臉超分辨率」,該領域專注於從失真或低分辨率圖像中重建更貼近真實的人臉。
最近在一個機器學習會議上,韓國高級科學技術研究院的研究人員發表了《通過對面部標記的關注,逐步提高人臉的超分辨率》的論文。研究人員在論文中提出了一種新的人臉識別方法,該方法可以生成 8 倍超分辨率的人臉圖像,並完全保留面部細節。

▲ 像素圖像,還原圖像和真實圖像的對比
為了鍛鍊 AI,研究人員採用了一種漸進的訓練方法。通過將網絡分成連續的步驟進行穩定的訓練,每個步驟的輸出的分辨率都在逐漸提高。他們還提出了一種新的面部注意力丟失方法,通過增加像素差和熱圖值來更好地恢復面部屬性。除此之外,訓練 AI 還用了最先進的人臉對齊網絡提取出適用於人臉 SR 的熱圖,以此減少訓練時間。
實驗結果證明,研究人員的方法在定性、定量測量、感知質量等方面都優於目前最先進的方法。利用人工智能的能力,我們從像素化的初始圖像中識別一個人會變得容易得多。

當然,這畢竟是 AI,還是有很多令人覺得啼笑皆非的成果。
Twitter 用户 @ jonathanfly 就把我們平常用的表情包模糊成像素塊去讓 AI 完成挑戰,表情包模糊後的大小正好為 16×16 像素。結果 AI 還原出來的結果有點「可怕」,本身像素化可愛風的鼻子眼睛都變成了真實向的人臉,看上去有點搞笑,變成了我們常用的魔性表情包。

但用真人照片像素化之後,正常的圖片還算貼近原貌。
如果調整了像素塊圖片的對比度,對齊人臉效果稍稍偏離就可能造成還原人臉的鼻飛眼斜。

如果你把披薩像素化之後再識別,那麼香腸也會變成性感紅唇。
不管是多奇怪的圖像最後都能長出人類的五官。

畢竟 AI 還是靠着我們教給它的東西在做圖像重建,所以還原出這些偏向人臉的效果其實也不讓人意外,目前還沒那麼完善也可以理解。
博客 I Forced A Bot 還嘗試了將像素化圖片從 16×16 調整到 128×128,然後再降低到 16×16。通過這樣的處理,他通常得到的都是一個更貼近真實人臉的結果。因為圖像更模糊能為 AI 的還原工作提供了更多創造性解釋圖像的空間。

I Forced A Bot 還發現了一個論文中沒有公佈的細節,有些生成的人臉圖像臉上會有黑色的不明物,博客作者將其成為「哈利波特的傷疤」。

到這,這個 AI 已經被人拿來做了各種各樣表情包的嘗試,看上去已經被徹底「玩壞了」。

但我們還是要承認,只要你不要把 AI 用在表情包還原上,那麼專注於模糊圖像還原的 AI 還是有非常積極的作用。如果在某個案件中捕捉到的嫌疑人圖像過於模糊,那麼 AI 很可能會成為呈現犯罪嫌疑人相貌的最後一環。
不過現有的技術還無法用於刑偵勘察,我們還是隻能等它學成歸來,再報效人類。
題圖來自 Pixel Art Maker。