谷歌攜手 UC 伯克利拋出王炸 IGN:要取代擴散模型,可單步生成逼真圖像_風聞
镜子里的陌生人-人来人往谁还在?潮起潮落我自观13小时前
IT之家 11 月 14 日消息,谷歌近日攜手加州大學伯克利分校(UC Berkeley),研發出了可取代擴散模型(Diffusion Models)的全新生成式 AI 方法--冪等生成網絡(IGN)。

包括生成對抗網絡(GAN)、擴散模型(Diffusion Models)和今年 3 月 OpenAI 發佈的一致性模型(Consistency Models)在內,當前主流生成式 AI 模型都是隨機噪點、草圖或者低分辨率或其他損壞的圖像等輸入,映射到與給定目標數據分佈相對應的輸出(通常是自然圖像)來生成圖像。

以擴散模型為例,在訓練期間學習目標數據分佈,然後通過多個步驟執行“去噪”處理。
谷歌研究團隊提出了名為冪等生成網絡(IGN)的全新生成模型,從任何形式的輸入中生成合適的圖像,理想情況下只需一步即可完成。
該模型可以想象為一種“全局投影儀”,將任何輸入數據投射到目標數據分佈上,和現有其它模型算法不同,不會限於特定的輸入。
IGN 和 GAN、擴散模型主要有兩點不同:
GAN 需要單獨的生成器和鑑別器模型,而 IGN 是“自我對抗”的,可以同時扮演着兩種角色。
擴散模型需要執行增量步驟,而 IGN 可以單個步驟中將輸入映射到數據分佈上。
研究人員使用 MNIST 和 CelebA 數據集展示了 IGN 的潛力。該團隊展示了一些應用,例如將草圖轉換為逼真的圖像、從噪點生成圖像或修復損壞的圖像等。

IT之家在此附上論文詳細地址,感興趣的用户可以深入閲讀。

