逼真到顫抖!Midjourney畫出完美中國情侶,畫師、演員、模特一鍵淘汰_風聞
你相信光吗-爱比丽屋03-20 18:13
來源:新智元
昨天,由Midjourney V5畫的一對中國情侶在網上引起軒然大波。
許多人紛紛驚呼:人類畫師別活了。

有人不相信這是Midjourney之作,也親手體驗了一把。在輸入以下的promot後,畫風瞬間驚豔了。
「A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen --v 5 --s 250 --q 2」

在GPT-4發佈後,Midjourney也更新了V5,不僅繪圖更逼真,而且prompt更靈敏。
最重要的是,一直被詬病的「AI 不會畫手指」,Midjourney V5都拿捏了。

還有滿屏的電影質感,除了OMG,還是OMG。

甚至有網友驚呼:模特不存在了!

效果炸裂,一大波設計師要失業了
從Midjourney的V1到V5,就可以看到AIGC這一年來的進化速度有多快。
最新V5版的圖像質量更高、輸出更多樣化、有更廣泛的風格、支持無縫紋理、有更寬的縱橫比、有更好的圖像提示,以及更寬的動態範圍……
激動的心,顫抖的手,國內網友紛紛上手實操了一波。
先上手的寫真圖:


雖然V5能夠畫出5根手指,但是在手指的細節上,還是差點意思。

比如試着讓Midjourney V5給梵高的房間拍個照:


Midjourney V5在畫中國美女的神態時,把控也是非常到位。

V5還能拿捏中國古典風格的美,畫出了亭亭玉立的美人,細節顆粒度拉滿。

還有網友用GPT-4+Midjourney V5創作了電影「杭州重生」,連豆瓣上介紹頁都P出來了,看起來還真是那麼回事兒。

在2022年12月,譚木匠舉辦了一場梳子比賽,人類設計師設計的梳子如下:

網友黃仲生用V5試了一波,並驚訝地發現「麻瓜」在AI面前完全不能打。


當別人反饋説上面的梳子太美,只能用來收藏,網友又整了一波日常可用的梳子。

還有給小朋友用的梳子

在國外,有網友直接用Midjourney V5畫出了The Matrix的電影質感,讓人瞬間懷疑這是不是電影裏的截圖。
並且獻上了prompt:
「Keanu Reeves in The Matrix. AI cinema. Synthography. Cinematic. Film grain. --ar 16:9 --v 5」


還有網友嘗試用「民宅火災現場微笑女孩」經典meme讓Midjourney創作「城堡火災現場微笑洛基」。

來看下這炸裂的效果。


網友還開腦洞把「北京屋頂情侶」圖加上洛基元素。

還有個搞笑版的,龍捲風來了,老太太騎着電驢在「狂飆」。

亞洲人的臉部特徵也是做的非常逼真。



旅行博主都不用出門,直接在家調教Midjourney就可以了。

還有網友拿V4和V5做了對比圖,通過輸入一張圖,還有文字提示,V4生成的圖片在光照下物體陰影處理方面無法與V5相比。

再來一張眼睛特寫圖:

通過對V3、V4、V5這三個版本輸入相同提示、相同設置,對其輸出圖片進行了對比。
在V5這個版本中,波光粼粼的水面,還有魚兒在水中游的倒影,已經達到了以假亂真的程度。


但是如果沒有提供有關環境的文本的提示,比起V4,V5默認生成了更加真的環境。

網友迫不及待地讓V5來複刻一下王家衞「藍莓之夜」的電影風格,發現V5在處理玻璃的反射方面做得更逼真了。

以及各種真假難辨的作品:

反派氣質拉滿的馬斯克:

「貓戴VR」:

比V4強在哪?
最新升級的V5,相較於前一版有什麼改進,一位研究員就他們之間的對比做了一張表:

1. 密鋪(--tile argument)
在創建模式時使用。此前V3有這一參數,然而在V4中暫時終止使用,V5版本重新上線。
比如輸入「/imagine tesseract pattern, repeat, white and blue highlights --s 1000 --v 5 --tile」,生成如下的圖:

2. 長寬比(--ar argument )
在V4中,只能有不高於1:2或不寬於2:1的自定義縱橫比。而在V5中,你可以自定義比率與任何「寬度: 長度」比,如下是自定義比例的演示:

這一點升級,意味着什麼?
現代電影中常見的最寬縱橫比2.39:1都能夠實現,你可以製作電影巨幕,人人都能成為導演!

V5生成2.4:1電影畫幕
3. 圖像權重可以自定義( -- iw argument)
圖像提示中的權重現在可以輸入自定義值。你可以決定輸入圖像對最終生成的圖像的影響程度。
如下,在Midjourney V5中,輸入一張圖和一句文本提示。

通過自定義不同權重,2、1、0.5生成了不同的圖片。
輸入的提示如下:「/imagine http://imgur.com/romman.png a roman soldier with daisies in the background --seed 123 --iw 2 --v 5」

4. less opinionated
「less opinionated」意味着,在V4中,只需要編寫較少的文本提示,Midjourney便會輸出更具創造性的圖像。
但V5不是這樣的,你可能需要輸入更多的形容詞,並給出更多的細節,比如風格或情緒,輸出圖像應該是什麼樣子。如果沒有更多描述,Midjourney就會輸出一個默認風格,比如「攝影」風格。
這一點升級,可以讓人們通過文本提示能夠更精準地把控Midjourney輸出的內容。也意味着,在輸入文本和輸出圖像之間有「更多的內聚力」。
以上4點升級是官方博客中提到,但是最讓人意想不到的是Midjourney V5能夠畫出「5個手指和腳趾」!


另外,V5已經在更真實的圖像/照片上進行了微調,因此可以看到在輸出窗户反射和透過玻璃的圖片上更加真實。


考考眼力見
最後來一個測試題:
下面4張圖,只有一張是真人,其他都是Midjourney V5畫的,猜猜真人是哪一張?





參考資料:
https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295