逼真到顫抖！Midjourney畫出完美中國情侶，畫師、演員、模特一鍵淘汰_風聞

你相信光吗-爱比丽屋03-20 18:13

2023-03-20

來源：新智元

昨天，由Midjourney V5畫的一對中國情侶在網上引起軒然大波。

許多人紛紛驚呼：人類畫師別活了。

有人不相信這是Midjourney之作，也親手體驗了一把。在輸入以下的promot後，畫風瞬間驚豔了。

「A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen --v 5 --s 250 --q 2」

在GPT-4發佈後，Midjourney也更新了V5，不僅繪圖更逼真，而且prompt更靈敏。

最重要的是，一直被詬病的「AI 不會畫手指」，Midjourney V5都拿捏了。

還有滿屏的電影質感，除了OMG，還是OMG。

甚至有網友驚呼：模特不存在了！

效果炸裂，一大波設計師要失業了

從Midjourney的V1到V5，就可以看到AIGC這一年來的進化速度有多快。

最新V5版的圖像質量更高、輸出更多樣化、有更廣泛的風格、支持無縫紋理、有更寬的縱橫比、有更好的圖像提示，以及更寬的動態範圍……

激動的心，顫抖的手，國內網友紛紛上手實操了一波。

先上手的寫真圖：

雖然V5能夠畫出5根手指，但是在手指的細節上，還是差點意思。

比如試着讓Midjourney V5給梵高的房間拍個照：

Midjourney V5在畫中國美女的神態時，把控也是非常到位。

V5還能拿捏中國古典風格的美，畫出了亭亭玉立的美人，細節顆粒度拉滿。

還有網友用GPT-4+Midjourney V5創作了電影「杭州重生」，連豆瓣上介紹頁都P出來了，看起來還真是那麼回事兒。

在2022年12月，譚木匠舉辦了一場梳子比賽，人類設計師設計的梳子如下：

網友黃仲生用V5試了一波，並驚訝地發現「麻瓜」在AI面前完全不能打。

當別人反饋説上面的梳子太美，只能用來收藏，網友又整了一波日常可用的梳子。

還有給小朋友用的梳子

在國外，有網友直接用Midjourney V5畫出了The Matrix的電影質感，讓人瞬間懷疑這是不是電影裏的截圖。

並且獻上了prompt:

「Keanu Reeves in The Matrix. AI cinema. Synthography. Cinematic. Film grain. --ar 16:9 --v 5」

還有網友嘗試用「民宅火災現場微笑女孩」經典meme讓Midjourney創作「城堡火災現場微笑洛基」。

來看下這炸裂的效果。

網友還開腦洞把「北京屋頂情侶」圖加上洛基元素。

還有個搞笑版的，龍捲風來了，老太太騎着電驢在「狂飆」。

亞洲人的臉部特徵也是做的非常逼真。

旅行博主都不用出門，直接在家調教Midjourney就可以了。

還有網友拿V4和V5做了對比圖，通過輸入一張圖，還有文字提示，V4生成的圖片在光照下物體陰影處理方面無法與V5相比。

再來一張眼睛特寫圖：

通過對V3、V4、V5這三個版本輸入相同提示、相同設置，對其輸出圖片進行了對比。

在V5這個版本中，波光粼粼的水面，還有魚兒在水中游的倒影，已經達到了以假亂真的程度。

但是如果沒有提供有關環境的文本的提示，比起V4，V5默認生成了更加真的環境。

網友迫不及待地讓V5來複刻一下王家衞「藍莓之夜」的電影風格，發現V5在處理玻璃的反射方面做得更逼真了。

以及各種真假難辨的作品：

反派氣質拉滿的馬斯克：

「貓戴VR」：

比V4強在哪？

最新升級的V5，相較於前一版有什麼改進，一位研究員就他們之間的對比做了一張表：

1. 密鋪（--tile argument）

在創建模式時使用。此前V3有這一參數，然而在V4中暫時終止使用，V5版本重新上線。

比如輸入「/imagine tesseract pattern, repeat, white and blue highlights --s 1000 --v 5 --tile」，生成如下的圖：

2. 長寬比（--ar argument ）

在V4中，只能有不高於1:2或不寬於2:1的自定義縱橫比。而在V5中，你可以自定義比率與任何「寬度: 長度」比，如下是自定義比例的演示：

這一點升級，意味着什麼？

現代電影中常見的最寬縱橫比2.39:1都能夠實現，你可以製作電影巨幕，人人都能成為導演！

V5生成2.4:1電影畫幕

3. 圖像權重可以自定義（ -- iw argument）

圖像提示中的權重現在可以輸入自定義值。你可以決定輸入圖像對最終生成的圖像的影響程度。

如下，在Midjourney V5中，輸入一張圖和一句文本提示。

通過自定義不同權重，2、1、0.5生成了不同的圖片。

輸入的提示如下：「/imagine http://imgur.com/romman.png a roman soldier with daisies in the background --seed 123 --iw 2 --v 5」

4. less opinionated

「less opinionated」意味着，在V4中，只需要編寫較少的文本提示，Midjourney便會輸出更具創造性的圖像。

但V5不是這樣的，你可能需要輸入更多的形容詞，並給出更多的細節，比如風格或情緒，輸出圖像應該是什麼樣子。如果沒有更多描述，Midjourney就會輸出一個默認風格，比如「攝影」風格。

這一點升級，可以讓人們通過文本提示能夠更精準地把控Midjourney輸出的內容。也意味着，在輸入文本和輸出圖像之間有「更多的內聚力」。

以上4點升級是官方博客中提到，但是最讓人意想不到的是Midjourney V5能夠畫出「5個手指和腳趾」！

另外，V5已經在更真實的圖像/照片上進行了微調，因此可以看到在輸出窗户反射和透過玻璃的圖片上更加真實。

考考眼力見

最後來一個測試題：

下面4張圖，只有一張是真人，其他都是Midjourney V5畫的，猜猜真人是哪一張？

參考資料：

https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295