加速开源生态布局腾讯混元3D世界模型发布即开源-经济参考网

7月27日，2025世界人工智能大会腾讯论坛上，腾讯正式发布混元3D世界模型1.0并宣布全面开源。这一业界首个支持沉浸式漫游、交互与仿真的开源世界生成模型，为游戏开发、VR及数字内容创作领域带来全新的可能性，同时腾讯混元还披露了涵盖多模态理解、端侧推理等模型的系列开源计划。

据介绍，混元3D世界模型1.0的核心优势在于高效生成与灵活适配。该模型融合全景视觉生成与分层3D重建技术，支持文字和图片双输入模式，能将传统建模团队数周的工作量压缩至几分钟。例如输入“一座中世纪城堡，城堡塔楼宏伟壮阔，城堡周围是一座石头雕像，石头铺成的路以及美丽的花朵，卡通风格”，模型可快速生成包含建筑、地形、植被的完整3D场景，输出的Mesh文件直接用于游戏原型搭建，还能灵活调整场景元素，满足个性化创作需求。

对普通用户而言，混元3D创作引擎降低了3D创作门槛。无需建模经验，通过一句话或一张图即可生成360°沉浸式空间，且场景可无缝导入VisionPro等设备，带来身临其境的体验。其创新的“语意层次化3D场景表征及生成算法”，将3D世界解构为不同语意层级，实现前景与背景智能分离，生成的标准化3DMesh资产兼容Unity、Blender等主流工具，支持元素独立编辑与物理仿真，无缝衔接AIGC与传统CG工作流。

腾讯混元的模型矩阵正持续进化。旗舰模型TurboS保持每月迭代，在代码与理科能力上稳居全球权威榜单前列；基于其打造的混元T1推理能力国内领先；多模态理解模型混元Vision在LMArenaVision榜单中位列国内第一，中文能力跻身全球第一梯队。3D生成领域，混元3D2.5模型在上海人工智能实验室6月评测中排名全球第一。

开源生态建设上，腾讯混元路线清晰。除本次开源的3D世界模型1.0，混元还将在月底开源一系列小尺寸模型，包含0.5B、1.8B、4B、7B混合推理模型，更轻量、好部署；多模态理解模型混元-large-vision及游戏视频生成框架混元GameCraft也将近期开源。此前发布的混元-A13B模型，以80B总参数、13B激活参数实现性能与效率平衡，开源3天即登上HuggingFace模型趋势榜第二。

首页 >> 正文