騰訊混元亮相WAIC 2025,發佈3D世界模型及系列開源模型
guancha
7月27日,2025世界人工智能大會騰訊論壇上,騰訊正式發佈混元3D世界模型1.0,並宣佈全面開源。這是業界首個開源可沉浸漫遊、可交互、可仿真的世界生成模型,為遊戲開發、VR、數字內容創作等領域帶來了全新的可能性。
除3D模型外,騰訊混元還披露了包括端側混合推理語言模型、多模態理解模型、遊戲視覺模型等在內的一系列開源計劃。
混元3D世界模型 1.0:一句話創造可漫遊的3D世界
作為此次發佈的亮點之一,騰訊混元3D世界模型1.0融合了全景圖像合成與分層3D重建技術,同時支持文字和圖片輸入,實現了高質量、風格多樣的可漫遊3D場景生成。過去需要專業建模團隊數週才能搭建的3D虛擬世界,現在只需一句文字或一張圖片,幾分鐘內即可生成。

混元世界模型1.0應用概覽(VR,遊戲開發,場景編輯,物理仿真等)
對遊戲開發者而言,混元3D世界模型極大簡化了3D場景構建流程,只需輸入“一座中世紀城堡,城堡塔樓宏偉壯闊,城堡周圍是一座石頭雕像,石頭鋪成的路以及美麗的花朵,卡通風格”等簡單指令,模型即可快速生成包含建築、地形、植被的完整3D場景。輸出的Mesh文件可用於遊戲原型搭建或關卡設計,還能靈活調整前景物體、更換天空背景,滿足個性化創作需求。

(生成界面演示:生成3D場景資產可二次編輯)

(文生 3D 漫遊場景效果展示:熾熱的岩漿形成河流,在黑色熔岩的地表上流動,蒸汽霧靄)
對於無建模經驗的普通用户,混元3D世界模型同樣友好易用,通過混元 3D 創作引擎,僅需一句話或者一張圖即可快速生成360°沉浸式視覺空間,生成的場景可無縫導入Vision Pro等虛擬頭顯,帶來沉浸式體驗。

(VR應用場景效果展示)
混元3D世界模型1.0的核心還在於其創新的“語意層次化3D場景表徵及生成算法”。該算法將複雜3D世界解構為不同語意層級,實現前景與背景、地面與天空的智能分離,不僅生成視覺效果逼真的整體場景,還能輸出標準化的3D Mesh資產,兼容Unity、Unreal Engine、Blender等主流工具。用户可對場景內元素進行獨立編輯或物理仿真,無縫銜接AIGC技術與傳統CG工作流。

(遊戲開發應用展示)

(物理仿真應用展示)
與全球領先的開源模型相比,混元3D世界模型1.0在文生世界、圖生世界的美學質量和指令遵循能力等關鍵維度均全面超越當前SOTA的開源模型。目前,混元3D世界模型1.0已全面開源。從秒級生成單個3D資產,到一鍵打造可漫遊的3D世界,騰訊混元正逐步構建完善的3D內容生成生態。
混元基座模型持續進化,綜合能力全球領先
騰訊混元的模型迭代正在悄悄加速。
混元旗艦模型TurboS自年初發布後,保持着每月一個版本的快速迭代,在代碼、理科能力和複雜指令遵循方面都有明顯提升,在全球大模型權威排行榜上穩居前列。混元TurboS創新採用了前沿的混合線性注意力機制與MoE模型架構,是大模型研發前沿分支的重要代表,這也是業界首個基於混合線性注意力機制落地的超大規模MoE模型。
基於TurboS基座,混元T1進一步提升了推理能力,憑藉架構創新和紮實的工程能力,混元T1綜合能力國內領先,在項目級代碼生成、高難度數學推理、文本寫作等方面都展現出不錯的效果。
端到端語音模型混元Voice、多模態理解模型混元Vision基於混元大語言模型基座打造,繼承了出色的理解、認知和推理能力。尤其在多模態理解上,今年連續發佈多款模型,在LMArena Vision全球大模型權威榜單中獲得國內榜首,在中文能力上穩居全球第一梯隊。

混元在多模態生成方面佈局全面,具備超高速生成高清圖的即時生圖能力和人物一致性可控的視頻生成能力。3D生成能力全球領先,最新混元 3D 2.5 模型質感大幅提升,在上海人工智能實驗室6 月評測中評測排名全球第一。同時,騰訊混元大模型在生產場景中也展現了巨大價值。全球首個AI設計智能體Lovart已首選調用混元3D模型的API接口,知名3D打印公司拓竹科技旗下的模型平台MakerWorld也已接入混元3D模型。
全面擁抱開源,共建社區生態
在會上,騰訊混元進一步明確了其全面擁抱開源的路線。
據介紹,除本次發佈即開源的混元 3D 世界模型 1.0,混元還將在月底開源一系列小尺寸模型,包含0.5B、1.8B、4B、7B混合推理模型,更輕量、好部署。在LMArena Vision榜單拿下國內第一的多模態理解模型混元-large-vision,以及專為遊戲場景優化的交互式遊戲視頻生成框架混元GameCraft等也將於近期對外開源。

前不久騰訊開源的企業級混合推理大語言模型混元-A13B,在總參數80B、激活參數僅13B的情況下,效果比肩同等架構的領先開源模型,同時推理速度更快,性價比更高。該模型因其在效率和性能上的平衡,發佈後在Hugging Face社區獲得了較高的關注度,開源僅 3 天,就拿下模型趨勢榜的第二名。
混元還開放了完整多模態生成能力及工具集插件,陸續開源了業界領先的文生圖、視頻生成和 3D 生成能力,提供接近商業模型性能的開源基座,方便社區基於業務和使用場景定製,圖像、視頻衍生模型數量分別達到 1400 和 1600 個,混元3D系列模型社區下載量超過 230 萬,已成為全球最受歡迎的3D開源模型。
騰訊混元 3D 世界模型 1.0:
l Github 項目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0
l 項目主頁:https://3d-models.hunyuan.tencent.com/world/
l 體驗地址:https://3d.hunyuan.tencent.com/sceneTo3D
l Hugging Face 模型地址:https://huggingface.co/tencent/HunyuanWorld-1