AI繪畫很快就能騙過整個互聯網了_風聞

差评-差评官方账号-03-21 09:06

2023-03-21

本文原創於微信公眾號：差評作者：世超

估計好多人早就聽説過 AI 畫手“ 不會畫手 ” 的笑話了。

細數起來， AI 在這上頭翻的車，那可是掰着手指頭都數不過來：

以至於有人説， “ 怎麼辨別這是不是 AI 畫的？看手就行了 ” 。

更有甚者，開了一個很大的腦洞：假如我帶上 “ 假手指 ” 再幹壞事，是不是就可以一口咬定監控是 AI 生成，從而逃脱罪責了？

要是在以前，用這個辦法説不定真就能矇混過去。

但現在想鑽這個漏洞的人，可以洗洗睡了。

因為就在不久前， Midjourney 公佈的第五代版本—— Midjourney V5 ，已經能畫出正常的手了。

看到 Midjourney 這個名字，是不是有人覺得眼熟？沒錯，它就是那個去年畫出《太空歌劇院》，在美術競賽拿了一等獎的 AI 繪畫平台。

Midjourney 把消息放出來後，好多人都忍不住去試了一把，用完發現它 “ 誠不欺我 ” ，畫出來的人手果然正常了：

對比一下，之前它畫出的人的手，是這個樣子：

所以曾經的它，到底對手指有什麼誤解啊。。。

而如今 Midjourney 能搞定手的難題，一個重要原因就是它有了好多關於手的數據。

AI 能畫畫，離不開數據。但現有的圖片裏，能露出手的可不多（相對像人臉這樣部位來説），再加上人的手非常靈活，能有很多種不同的姿勢。

指望 AI 自己能學會識別，那真是為難它了。

之前要想讓 AI 畫出像樣的手，要麼是平台專門僱人給圖片裏的人手打上標記，像把手掌、拇指、食指啥的，都給清楚地標出來；

要麼就得用户費點心，在輸入提示詞的時候，説得詳細一點。有人曾經在用上百個字的提示詞，讓 AI 成功畫出一點毛病都沒有的手：

可這種辦法顯然不適合大多數用户，且不説有沒有這個耐心，就是知道該輸入哪些提示詞這事，恐怕都得有點專業背景才行。

而 Midjourney 這次升級的新版本，利用了社區裏那些專業老哥反饋的海量手部數據，迭代了一波，從而能畫出正常的手。

除了能畫出正常的手，這次推出的第 5 版，還有其他方面的升級。

例如，最讓 Midjourney 得意的，是 V5 對光線、人物表情這樣的細節處理得更好了，能讓生成圖片更加逼真。

此前 Midjourney 最擅長生成的，都是幻想風格的，即使讓它畫現實的東西，也會透出一絲絲的不真實。

而現在的 V5 ，畫得就非常寫實了，像下面這張，你要是不説是 AI 畫的，我真會相信是照相機拍出來的。。。

難怪國外有個叫 Julie Wieland 的平面設計師，會給出這樣的評價： “MJ v5 就像給近視患者戴上眼鏡，效果清晰， 4K 細節拉滿，太不可思議了 ” 。

另外， V5 對輸入的提示理解能力更強，輸出的圖片也更有創意。

假如你輸入 “ 一個肌肉發達的野蠻人，在 CRT 電視機旁邊拿着武器、電影、 8K 、演播室照明 ” ，那麼 Midjourney V3 （左）、 V4 （中）和 V5 （右）分別會生成如下的圖片：

還有一個功能，網上提到的不多，但我覺得非常有用，那就是它能反向操作，從 “ 圖像到文本 ” 。

你可以上傳一張圖片，然後它就能告訴你，要想生成這個圖像，該輸入哪些提示詞。

舉個例子，如果你上傳一張埃菲爾鐵塔的照片，它就會告訴你，這張圖片的提示詞是 “ 位於巴黎的倒金字塔形狀的大型金屬結構 ” 。

有了這個功能，你就能知道 AI 是咋想的，下次你再想讓它生成你需要的圖片時，就能省不少勁。

而除了 Midjourney 之外，最近另一家在 AI 繪畫行業呼風喚雨的平台—— Stable Diffusion ，其實也有新動作了。

他們推出了 Stable Diffusion Reimagine ，這玩意可以用圖來生成圖。

據 Stability AI 説，這個工具的使用體驗非常友好，不需要輸入任何提示詞，只要一鍵上傳圖片，它會聯想、重新創作 3 張不同的照片。

他們展示了一個案例，給它上傳一張卧室裝修的圖片，它自動生成了 3 張風格、位置各不相同的圖片。

你要是不滿意，可以點擊圖片的重置按鈕， 2 秒鐘就能完成圖片的再次生成，只要你願意可以無限重置下去。

對於這麼好玩的功能，網友們當然不會放過。

一個日本網友上傳了一張二次元妹子的圖片， Reimagine 馬上返給了他三張：

我也試了一下，上傳了火鍋的照片，結果是這樣的：

但感覺生成的圖片一點都不像火鍋。。。

我這還算好的，有人上傳了非高清圖片，發現它生成的圖片非常感人，像下面這個就是：

還真是 Reimagine （重新想象）啊。。。

Stability.AI 倒也坦然，他們大方承認，這項生成式 AI 技術 “ 可以根據某些圖像激發驚人的結果，而對其他圖像產生不太令人印象深刻的結果 ” 。

用人話説就是 Stable Diffusion Reimagine 的畫畫水平相當不穩定，有時畫出來的東西讓人驚豔，有時畫得就很拉胯。

就像段譽一樣，時靈時不靈。。。

對於這點，有人分析，這和 Stability AI 在模型中安裝了一個過濾器有關。

這個過濾器是用來阻止不適當的請求，但過濾器有時會把正常的請求誤認為有問題，導致輸出的結果稀奇古怪。

儘管如此，還是得承認， Stable Diffusion 這個技術確實很牛，有開創性。

因為它是用圖像編碼器替換了原始文本編碼器，換句話説，就是 Reimagine 會把你上傳的原圖完全編碼，再用算法生成全新的圖，這意味着它根本沒用原圖的任何一個像素。

就衝下面這張圖，這話我信。。。

看完這些，我不得不感嘆，技術的進步速度實在是快。

就在不久前，不少人還在嘲笑 AI 繪畫連手都畫不明白，取代人類畫師根本就是痴心妄想。

沒想到， AI 這麼快就把短板補上來了，雖説它還有很多不完美的地方，但誰敢小瞧它未來的發展呢。

現在，我莫名地期待 OpenAI 旗下的 DALL-E 2 的新消息了，真不知道它要是和 GPT-4 雙劍合璧，會帶來啥新花樣。

圖片、資料來源：

微博、知乎

AI畫手會畫手了！Stable Diffusion學會想象，卷趴人類提示工程師

以圖生圖！Stability.ai發佈生成式人工智能工具

https://arstechnica.com/information-technology/2023/03/ai-imager-midjourney-v5-stuns-with-photorealistic-images-and-5-fingered-hands/