隱姓埋名的小香蕉,悄悄吊打了所有生圖模型_風聞
差评XPIN-差评官方账号-用知识和观点Debug the world!08-29 09:48
前一陣子,大模型競技場 LMArena 裏面悄咪咪地出現了一個神秘的圖片模型 —— nano-banana,在一眾生圖模型裏面亂殺。
這個小香蕉無名無姓,可一旦在 LMArena 抽到它,對手必被吊打。

這個神秘的模型在生圖一致性上強得驚人,對提示詞的理解和完成度也好得可怕。大夥兒你一票我一票,迅速把它送上了榜單第一位。
就在眾人紛紛猜測新模型到底出身哪個高門大户的時候,谷歌 AI Studio 的產品 Leader 跳出來發了一個香蕉,暗戳戳地認領了 nano-banana。

而就在昨天,nano-banana 終於正式上線谷歌 AI Studio,直接去 Gemini 那裏就能玩,不用競技場費事抽卡了。
谷歌在官方博客裏是這麼秀肌肉的:開局一張臉,以後不管是啥場景,啥服裝,啥表情,都能讓人一眼看出來你還是你。

把幾張照片搓在一起,生成的結果既能保證原來的形象不崩,又能保證新圖片看起來不違和。

還能多輪對話改同一張圖,每次只改一點點,其它部分就像是媽生原圖一樣,絲毫不變。

官方的案例看起來是挺吊的,還沒玩上的差友也別急,咱這就帶大夥兒一起體驗一下。
為了感受一下其它模型和 nano-banana 的差距,我們先上 LMArena 去抽了幾波卡。
結果是,一共抽了十幾輪,只要謎底裏有 banana,你一定會盲選 banana。。。有些對比還是非常慘烈的。
像是讓人物手裏加一根香蕉,右邊 seededit 的手崩了,香蕉的顏色也過於鮮豔,和整體畫風不搭,但左邊基本挑不出啥毛病。

再比如讓魯迅不要抽煙改拿筆,右邊這個細節變了一堆不説,筆頭還冒着煙呢。

這麼看來,nano-banana 比現在的生圖模型都強是沒啥疑問的。但它具體強在哪些方面呢?我們又去谷歌 Studio 有針對性地測了測。
先説結論,我們覺得 nano-banana 最強的點,是它對圖片有了更深入的理解,保證了一致性。而在強一致性的基礎上,修圖、換風格、做 3D 手辦。。。它非常全面,啥都幹得挺好。
比如這種一鍵試穿,需要把平鋪的各種服飾 P 到人的身上,而 nano-banana 對細節的把控非常到位。
鞋本來提供的是側面圖,但它畫出了正面的樣子。服飾上各種 logo 拼的都是對的,甚至 T 恤上原本鏡像的 ‘SAINT LAURENT’,在生圖的過程中也變回來了。

我們還試了試人臉的不同角度生成,這個效果是真的很厲害。
下面這三張圖,只有第一張是真實照片,後面兩張都是生成的。

這種面部方向的調整在老模型裏是很難實現的,因為要通過一張平面圖理解一張立體的臉各個角度長啥樣很難,但 nano-banana 的完成度也非常高。
另外,我們還測了一些合照拉郎配。
可以看得出,在這種合照裏,它做的不只是把兩個人物拼在一起,而是學習到了面部特徵。這樣生成的新圖片即使表情不太樣,還是能讓人一眼看出這是小馬小札。

還有大夥兒最愛的 3D 手辦系列,分分鐘把 100 多斤的火鍋壓縮成茶杯犬,化身桌面可愛小擺件,火鍋羣裏的同事們紛紛求出貨。

最牛的還屬這一張 —— 火鍋前陣子右後腿皮膚病剃禿了一塊,而生成的圖片居然注意到了這一點,一致性真拉滿了。

不過有一説一,nano-banana 的圖像風格變換比較中規中矩,倒是沒啥特別的。
但在這個過程中,我們發現它不光在處理圖片,還在偷偷 “ 認人 ”。
像是下面這張圖,在我們沒有告訴誰是誰的情況下,它還是認出來左邊是搞火箭的馬斯克,右邊是 META 的扎克伯格。

我們又試了幾個地標開盒,看看它有沒有 GPT 那樣的推理能力。

但實際上它只在地標建築物上比較好使,更像是圖像識別 + 記憶檢索,只能説有一點推理能力,但不多。
左 nano-banana 答錯,右 GPT 5 Thinking 答對

除了上述的優點,它的缺點其實也不少。。。最大的問題就是,谷歌好像給它做了不少安全性調教,經常這也不行,那也不行,有時候真摸不清哪個關鍵詞又觸犯天條了。

其次是對提示詞要求比較高,往好了説,是 nano-banana 對提示詞的遵循能力強,但實際上對用户來講,得多花不少時間打磨提示詞,有點折磨。
谷歌自己也表示,別讓 Gemini 猜你的心思,有啥想要的儘管説出來。

所以要是出來的效果不好,寫提示詞的時候就得儘量詳細一些,什麼要動,什麼不要動通通列明白,才能保證強一致性。
最後,比起咱心目中的 P 圖白月光 FLUX,它在局部小範圍修圖上效果還是差了一點,所以還是建議大夥兒精修找 FLUX,上面各種整大活兒再用 nano-banana。
左原圖,中 nano-banana,右 FLUX

總的來説,nano-banana 強就強在它對圖片的理解能力是目前最好的,而且各種任務上的一致性都不錯,沒有大短板。
更大的好消息是,小香蕉已經被整合進了 2.5 Flash 版本,即使沒有 pro 會員,免費的賬户也可以使用。
只要左上角選擇 2.5 Flash,對話框 tools 選擇 Image 即可。

LMAreana 上也依然可用,只要 prompt 開頭輸入 “ 使用 nano-banana 模型生成 ” ,有極高概率可以抽到。
或者有些整合網站像是 LibLib,Fal-ai 等等也有第三方提供的 nano-banana。

感興趣的差友趕緊去試試吧,歡迎回來評論區返圖哦。
圖片、資料來源:
莫莫實測
愛火鍋協會
X
