英偉達最新研究:LATTE3D將文字轉換成3D形狀_風聞
科闻社-科闻社官方账号-天助自助者53分钟前

英偉達(NVIDIA)最新的研究成果顯示,他們的研究人員成功地將文字轉換為3D形狀,並且在這一過程中注入了雙倍的加速力量。這項創新被稱為LATTE3D,類似於一台虛擬的3D打印機,可以在一秒內將文字提示轉換為物體和動物的3D表示形式。這一技術的應用範圍十分廣泛,包括開發電玩遊戲、廣告活動、設計元素,以及機器人的虛擬訓練場域等領域。
據英偉達AI研究副總裁Sanja Fidler介紹,LATTE3D是由位於多倫多的AI實驗室團隊開發的。僅一年前,要生成這種質量的3D視覺效果可能需要一個小時,而現在的最新技術只需約10到12秒。這一進步使得各產業的創作者能夠實現近乎實時的文字到3D生成。值得注意的是,當在單個GPU上運行推論時,像NVIDIA RTX A6000這樣的GPU,LATTE3D甚至能夠幾乎立即生成3D形狀。
創作者無需從頭開始設計或在3D資源庫內進行搜尋,而是可以利用LATTE3D在想法突然出現時,立即產生詳細的對象。此外,該模型基於每個文字提示生成幾種不同的3D形狀選項,供創作者選擇。選定的物體可以在幾分鐘內進行優化,達到更高的質量。然後,用户可以將形狀導出到圖形軟件應用程序或平台,如英偉達 Omniverse,該平台支持基於通用場景描述(OpenUSD)的3D工作流程和應用程序。
LATTE3D的研究人員在動物和日常物體這兩個特定數據集上進行了訓練,但是開發人員可以使用相同的模型架構在其他數據類型上進行訓練AI。例如,在3D植物資料集上進行訓練,LATTE3D可以幫助景觀設計師在與客户進行腦力激激盪時使用樹木、開花灌木和多肉植物快速填充花園渲染圖。此外,在家庭物品數據集上進行訓練,該模型可以產生填充家庭3D模擬的物品,開發人員可以使用這些物品來訓練個人助理機器人,然後再於現實世界中進行測試和部署。
目前,LATTE3D使用英偉達AA100 Tensor核心GPU進行訓練。除了3D形狀外,該模型還接受了使用ChatGPT生成的各種文字提示的訓練,以提高模型處理用户可能想出描述特定3D對象的各種短語的能力,例如,理解具有各種犬類物種的提示都應該產生像狗一樣的形狀。
這一研究成果展示了英偉達在生成式人工智能領域的巨大潛力,LATTE3D的問世將為創作者們帶來更快、更高質量的文本到3D形狀轉換體驗,進一步推動了虛擬環境應用的發展。
*免責聲明:以上內容整理自網絡,僅供交流學習之用。如有內容、版權問題,請留言與我們聯繫進行刪除。