AI繪畫很快就能騙過整個互聯網了_風聞
差评-差评官方账号-03-21 09:06
本文原創於微信公眾號:差評作者:世超
估計好多人早就聽説過 AI 畫手“ 不會畫手 ” 的笑話了。
細數起來, AI 在這上頭翻的車,那可是掰着手指頭都數不過來:



以至於有人説, “ 怎麼辨別這是不是 AI 畫的?看手就行了 ” 。
更有甚者,開了一個很大的腦洞:假如我帶上 “ 假手指 ” 再幹壞事,是不是就可以一口咬定監控是 AI 生成,從而逃脱罪責了?

要是在以前,用這個辦法説不定真就能矇混過去。
但現在想鑽這個漏洞的人,可以洗洗睡了。
因為就在不久前, Midjourney 公佈的第五代版本—— Midjourney V5 ,已經能畫出正常的手了。

看到 Midjourney 這個名字,是不是有人覺得眼熟?沒錯,它就是那個去年畫出《 太空歌劇院 》,在美術競賽拿了一等獎的 AI 繪畫平台。
Midjourney 把消息放出來後,好多人都忍不住去試了一把,用完發現它 “ 誠不欺我 ” ,畫出來的人手果然正常了:


對比一下,之前它畫出的人的手,是這個樣子:

所以曾經的它,到底對手指有什麼誤解啊。。。
而如今 Midjourney 能搞定手的難題,一個重要原因就是它有了好多關於手的數據。
AI 能畫畫,離不開數據。但現有的圖片裏,能露出手的可不多( 相對像人臉這樣部位來説 ),再加上人的手非常靈活,能有很多種不同的姿勢。
指望 AI 自己能學會識別,那真是為難它了。
之前要想讓 AI 畫出像樣的手,要麼是平台專門僱人給圖片裏的人手打上標記,像把手掌、拇指、食指啥的,都給清楚地標出來;

要麼就得用户費點心,在輸入提示詞的時候,説得詳細一點。有人曾經在用上百個字的提示詞,讓 AI 成功畫出一點毛病都沒有的手:

可這種辦法顯然不適合大多數用户,且不説有沒有這個耐心,就是知道該輸入哪些提示詞這事,恐怕都得有點專業背景才行。
而 Midjourney 這次升級的新版本,利用了社區裏那些專業老哥反饋的海量手部數據,迭代了一波,從而能畫出正常的手。
除了能畫出正常的手,這次推出的第 5 版,還有其他方面的升級。
例如,最讓 Midjourney 得意的,是 V5 對光線、人物表情這樣的細節處理得更好了,能讓生成圖片更加逼真。
此前 Midjourney 最擅長生成的,都是幻想風格的,即使讓它畫現實的東西,也會透出一絲絲的不真實。

而現在的 V5 ,畫得就非常寫實了,像下面這張,你要是不説是 AI 畫的,我真會相信是照相機拍出來的。。。

難怪國外有個叫 Julie Wieland 的平面設計師,會給出這樣的評價: “MJ v5 就像給近視患者戴上眼鏡,效果清晰, 4K 細節拉滿,太不可思議了 ” 。
另外, V5 對輸入的提示理解能力更強,輸出的圖片也更有創意。
假如你輸入 “ 一個肌肉發達的野蠻人,在 CRT 電視機旁邊拿着武器、電影、 8K 、演播室照明 ” ,那麼 Midjourney V3 ( 左 )、 V4 ( 中 )和 V5 ( 右 )分別會生成如下的圖片:

還有一個功能,網上提到的不多,但我覺得非常有用,那就是它能反向操作,從 “ 圖像到文本 ” 。
你可以上傳一張圖片,然後它就能告訴你,要想生成這個圖像,該輸入哪些提示詞。
舉個例子,如果你上傳一張埃菲爾鐵塔的照片,它就會告訴你,這張圖片的提示詞是 “ 位於巴黎的倒金字塔形狀的大型金屬結構 ” 。
有了這個功能,你就能知道 AI 是咋想的,下次你再想讓它生成你需要的圖片時,就能省不少勁。

而除了 Midjourney 之外,最近另一家在 AI 繪畫行業呼風喚雨的平台—— Stable Diffusion ,其實也有新動作了。
他們推出了 Stable Diffusion Reimagine ,這玩意可以用圖來生成圖。
據 Stability AI 説,這個工具的使用體驗非常友好,不需要輸入任何提示詞,只要一鍵上傳圖片,它會聯想、重新創作 3 張不同的照片。
他們展示了一個案例,給它上傳一張卧室裝修的圖片,它自動生成了 3 張風格、位置各不相同的圖片。

你要是不滿意,可以點擊圖片的重置按鈕, 2 秒鐘就能完成圖片的再次生成,只要你願意可以無限重置下去。
對於這麼好玩的功能,網友們當然不會放過。
一個日本網友上傳了一張二次元妹子的圖片, Reimagine 馬上返給了他三張:

我也試了一下,上傳了火鍋的照片,結果是這樣的:

但感覺生成的圖片一點都不像火鍋。。。
我這還算好的,有人上傳了非高清圖片,發現它生成的圖片非常感人,像下面這個就是:

還真是 Reimagine ( 重新想象 )啊。。。
Stability.AI 倒也坦然,他們大方承認,這項生成式 AI 技術 “ 可以根據某些圖像激發驚人的結果,而對其他圖像產生不太令人印象深刻的結果 ” 。
用人話説就是 Stable Diffusion Reimagine 的畫畫水平相當不穩定,有時畫出來的東西讓人驚豔,有時畫得就很拉胯。
就像段譽一樣,時靈時不靈。。。

對於這點,有人分析,這和 Stability AI 在模型中安裝了一個過濾器有關。
這個過濾器是用來阻止不適當的請求,但過濾器有時會把正常的請求誤認為有問題,導致輸出的結果稀奇古怪。
儘管如此,還是得承認, Stable Diffusion 這個技術確實很牛,有開創性。
因為它是用圖像編碼器替換了原始文本編碼器,換句話説,就是 Reimagine 會把你上傳的原圖完全編碼,再用算法生成全新的圖,這意味着它根本沒用原圖的任何一個像素。
就衝下面這張圖,這話我信。。。

看完這些,我不得不感嘆,技術的進步速度實在是快。
就在不久前,不少人還在嘲笑 AI 繪畫連手都畫不明白,取代人類畫師根本就是痴心妄想。
沒想到, AI 這麼快就把短板補上來了,雖説它還有很多不完美的地方,但誰敢小瞧它未來的發展呢。
現在,我莫名地期待 OpenAI 旗下的 DALL-E 2 的新消息了,真不知道它要是和 GPT-4 雙劍合璧,會帶來啥新花樣。
圖片、資料來源:
微博、知乎
AI畫手會畫手了!Stable Diffusion學會想象,卷趴人類提示工程師
以圖生圖!Stability.ai發佈生成式人工智能工具
https://arstechnica.com/information-technology/2023/03/ai-imager-midjourney-v5-stuns-with-photorealistic-images-and-5-fingered-hands/
