英偉達最新研究：LATTE3D將文字轉換成3D形狀_風聞

科闻社-科闻社官方账号-天助自助者53分钟前

2024-03-26

英偉達（NVIDIA）最新的研究成果顯示，他們的研究人員成功地將文字轉換為3D形狀，並且在這一過程中注入了雙倍的加速力量。這項創新被稱為LATTE3D，類似於一台虛擬的3D打印機，可以在一秒內將文字提示轉換為物體和動物的3D表示形式。這一技術的應用範圍十分廣泛，包括開發電玩遊戲、廣告活動、設計元素，以及機器人的虛擬訓練場域等領域。

據英偉達AI研究副總裁Sanja Fidler介紹，LATTE3D是由位於多倫多的AI實驗室團隊開發的。僅一年前，要生成這種質量的3D視覺效果可能需要一個小時，而現在的最新技術只需約10到12秒。這一進步使得各產業的創作者能夠實現近乎實時的文字到3D生成。值得注意的是，當在單個GPU上運行推論時，像NVIDIA RTX A6000這樣的GPU，LATTE3D甚至能夠幾乎立即生成3D形狀。

創作者無需從頭開始設計或在3D資源庫內進行搜尋，而是可以利用LATTE3D在想法突然出現時，立即產生詳細的對象。此外，該模型基於每個文字提示生成幾種不同的3D形狀選項，供創作者選擇。選定的物體可以在幾分鐘內進行優化，達到更高的質量。然後，用户可以將形狀導出到圖形軟件應用程序或平台，如英偉達 Omniverse，該平台支持基於通用場景描述（OpenUSD）的3D工作流程和應用程序。

LATTE3D的研究人員在動物和日常物體這兩個特定數據集上進行了訓練，但是開發人員可以使用相同的模型架構在其他數據類型上進行訓練AI。例如，在3D植物資料集上進行訓練，LATTE3D可以幫助景觀設計師在與客户進行腦力激激盪時使用樹木、開花灌木和多肉植物快速填充花園渲染圖。此外，在家庭物品數據集上進行訓練，該模型可以產生填充家庭3D模擬的物品，開發人員可以使用這些物品來訓練個人助理機器人，然後再於現實世界中進行測試和部署。

目前，LATTE3D使用英偉達AA100 Tensor核心GPU進行訓練。除了3D形狀外，該模型還接受了使用ChatGPT生成的各種文字提示的訓練，以提高模型處理用户可能想出描述特定3D對象的各種短語的能力，例如，理解具有各種犬類物種的提示都應該產生像狗一樣的形狀。

這一研究成果展示了英偉達在生成式人工智能領域的巨大潛力，LATTE3D的問世將為創作者們帶來更快、更高質量的文本到3D形狀轉換體驗，進一步推動了虛擬環境應用的發展。

*免責聲明：以上內容整理自網絡，僅供交流學習之用。如有內容、版權問題，請留言與我們聯繫進行刪除。