你昨晚關注的那個福利姬,可能是假的_風聞
差评-差评官方账号-02-26 07:55
本文原創於微信公眾號:差評作者:世超
前兩天,有同事在編輯部的車車羣裏來了一組圖:
如圖示 ▼






平時毫無聲息的羣裏,頓時人潮湧動,大家紛紛指責他不厚道,留圖不留種。

在眾人的好言勸説(威逼利誘)下,他留下了一串藍色的鏈接。

嗯?AI!你跟我説 這些圖全是 AI 畫的??
一張真人都沒有???
鏈接裏的 Civitai 是一個 AI 畫圖模型分享網站,有大量來自世界各地的煉丹師(調試 AI 的人)把自己訓練的 AI 模型分享上來。

不過這部分內容估計大家已經不陌生了,我就不多贅述了。
之所以老調重談,是因為微軟往 AI 畫圖圈子裏扔了個新東西:LoRA。

説人話就是,以前的 AI 畫圖模型就像是焊死的一體機。不論是換硬盤、顯卡還是內存,都得整塊主板一起換,整體重裝。
但是微軟搞出來的這個 LoRA,把 AI 畫圖的模型給 “模塊化” 了,可以單獨訓練背景、人臉、風格等等。
等真正畫圖的時候,再像拼積木一樣,把好多 LoRA 模型拼起來就好。
這麼做的好處顯而易見:自由度更高,並且對資源的開銷更小。
以 Civitai 上的 DingZhenLora 模型為例,作者只是用15張丁真的照片,就生成了一個效果還行的丁真 Cosplay****AI,而且它的模型大小更是不到150MB。
放在以前,這幾個數後面至少得加個 0。

更厲害的是,作者 “武當山真人” 只用 3070 跑了 20 分鐘,就生成了這個模型。。。

十幾張原始樣本,3070的算力只需要不到半小時。。。訓練 AI 的門檻,已經這麼低了嗎!
還不趕緊親自試一下!
從米羅那薅幾十張美照,然後找個3070Ti的電腦,開煉!
米羅美照▼

確實只用了半個多小時,我們的抽象米羅生成器就誕生了!
快是真的快!
不過,效果稍微有點那啥。。。

看來,玩定製AI也並不是有手就行。
我研究了一下發現,假如要想做到像之前提到的 DingZhen LoRA 那麼像,還需要花更多的時間去細緻的調節一下小的模型參數。
然而,我還沒來得及喝口茶,坐下來,開始研究調參,又有一個功能勁爆程度絲毫不亞於LoRA的新技術出現了。。。
這次的主角叫ControlNet,它能夠引導 AI 輸出更精確的內容。

不知道大家發現沒有,咱們平常在網上看到的 AI 生成圖片,裏面的人物姿勢總是大同小異?
這是因為 AI 會有一種 “惰性”,更喜歡生成接近原圖(訓練素材)的內容。

以前要想讓 AI 生成不同姿勢的圖片,就得使用提示詞(抬頭、向左看、跑步……)。
但是很多時候,提示詞很難精確描述我們想要的姿態 —— 而且 AI 也不一定能正確理解。
就比如,早期 AI 不能理解啥是游泳。

ControlNet 就能很好的解決這個問題。
只要上傳一張人物照片給 ControlNet,它就能分析這張圖片的人物肢體框架,然後指揮 AI 生成肢體動作類似的新圖片。
完全不需要任何姿勢相關的提示詞!

光是這一點,ControlNet 就足夠神奇了。。。
而且這還沒完,僅僅就是一個週末的功夫,ControlNet 又被發現了一個足以改變AI畫圖歷史的用法!
它可以通過骨架控制手型 —— AI 會畫手了!!!

估計大家早就聽説過 AI “不會畫手” 的笑話,甚至已經有人腦洞大開了:
假如我帶上 “假手指” 再幹壞事,是不是就可以一口咬定監控是 AI 生成,從而逃脱罪責了?

呵呵,這些人的想法可以胎死腹中了。
而除了控制人物骨架,ControlNet 在上色和草稿補全方面也更進一步,正確理解了草稿中空白區域是“未塗色”,而不是“白色”。

在這之前,假如你餵給 AI 一張沒上色的黑白草稿,它真就只會給你生成一張“黑白照”出來。。。

非常陰間。
哦對了,説到精確控制和上色。。。
就在我剛看完 ControlNet 能幹嘛之後,還沒來得及上手用,羣裏就又討論起另外一個 AI 了。。。
和前文提到的那些非商業的模型不同,這次他們聊的 “ArkoAI” 是一款商業AI。
這款 AI 是專門為“土木工程”設計的,能把隨手畫的建築的外觀草圖轉換成概念渲染圖。
這效果,感覺和真的建了一個3D模型一樣。

連傳統工業軟件都開始入局,在我看來,AI 畫圖終於算是邁出了從“非常酷的玩具”到“新時代生產力工具”的這一步。
以前的 AI 只能生成一些短視頻漫畫風格照、渲染一些異形一樣的人物照,而且對於指令的響應相當玄學。。。

但是現在,AI 已經可以製作一打演示圖(甲方點頭就行),生成一組情頭(約稿的老闆滿意就行),渲染一堆現實中不存在的完美小姐姐(阿宅起立就行)。。。
我們不得不承認,AI****畫圖已經能完成需要一些創意,但精確度要求不高的工作了。
而且最主要的是,現在這方面的技術發展實在是太快了!!!
就這一個週末,先是 LoRA,後是 ControlNet,然後 ArkoAI 也出來刷了一波存在。。。我從來沒見過 AI 技術發展的這麼迅速過!
我真的猜不到,明天一覺醒來,AI 又會帶來一些什麼驚喜。
圖片、資料來源:
civitai,Korean Doll Likeness
civitai,DingZhenLora
Github,lllyasviel/ControlNet
Github,microsoft/LoRA
arxiv,Adding Conditional Control to Text-to-Image Diffusion Models
arxiv,LoRA: Low-Rank Adaptation of Large Language Models
ArkoAI——超級助理建築師來了
