腾讯混元3D 世界模型2.0开源:AI从"对话助手"进化为"世界创造者"
2026年4月16日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0),这是AI从"对话助手"进化为"世界创造者"的里程碑事件。过去,3D世界建模需要专业团队数周甚至数月的时间,而现在,只需输入文字、上传图片或视频,AI即可自动生成完整的3D世界,并可直接输出可编辑的3D资产文件,无缝对接Unity、UE等主流游戏引擎。
一、混元3D世界模型2.0的核心突破
| 版本对比 | 混元世界模型1.0 / Genie3等 | 混元世界模型2.0 |
|---|---|---|
| 输出格式 | 视频文件 | 可编辑的3D资产文件 |
| 游戏引擎对接 | 不支持 | 无缝对接Unity、UE等主流游戏引擎 |
| 内容形态 | 生成场景片段 | 生成包含人、物、景的完整3D世界 |
二、多模态输入能力
混元3D世界模型2.0支持多种类型的输入:
- 文字输入:用自然语言描述你想要的3D世界,AI自动解析复杂语义,一键生成
- 图片输入:上传参考图片,AI提取风格和元素,生成相似风格的3D世界
- 视频输入:输入真实空间视频,AI复刻真实3D场景,构建数字孪生空间
三、3D资产生成与导出格式
混元3D世界模型2.0支持多种3D资产格式导出:
| 导出格式 | 适用场景 |
|---|---|
| Mesh | 通用3D模型格式,兼容大多数3D软件 |
| 3DGS(3D高斯泼溅) | 高质量真实感渲染,可直接导入游戏引擎 |
| 点云 | 用于进一步处理或分析 |
关键优势:生成的3D资产可直接二次编辑,设计师可以在游戏引擎中对AI生成的世界进行精细调整,大幅提升游戏地图和关卡的制作效率。
四、风格自定义与角色交互
风格自定义
混元3D世界模型2.0支持多种风格输出:
- 真实风:生成逼真的现实世界场景
- 漫画风:生成二次元风格的3D世界
- 游戏风:生成适合游戏使用的低多边形风格场景
角色交互模式
用户可操作角色在生成的3D场景中自由探索,具有物理碰撞效果。这一功能为游戏开发者提供了快速原型验证能力——在正式建模之前,即可测试关卡设计和游戏机制。
五、数字孪生构建能力
混元3D世界模型2.0在数字孪生领域也具有强大能力:
- 输入真实空间视频或多视角图片
- 可构建高精度数字孪生空间
- 支持任意尺寸图像与视频输入
- 一次性预测密集点云、多视角深度图、表面法线等
基于WorldMirror 2.0架构,混元3D世界模型2.0还配备了HY-WorldStereo新视角生成模型,可实现精确相机控制与细粒度视觉细节保持,空间一致性记忆机制确保新区域与已有区域完美衔接。
六、对游戏开发工作流的影响
传统游戏地图和关卡制作流程:
- 概念设计 → 2. 美术制作3D模型 → 3. 导入引擎搭建场景 → 4. 测试与迭代
这一流程通常需要数周甚至数月的时间,且需要专业的3D美术师参与。
混元3D世界模型2.0带来的变革:
- 输入文字/图片/视频 → 2. AI生成3D世界 → 3. 导入引擎二次编辑 → 4. 完成
整个流程可缩短至数小时,且对3D美术技能的要求大幅降低。这将使得更多独立游戏开发者能够创造出高质量的游戏世界。
七、开源意义与生态建设
腾讯将混元3D世界模型2.0正式开源,提供:
- 完整的模型权重与代码
- 详细的技术报告
- 在线体验申请入口
开源策略将加速AI 3D生成技术的普及,吸引更多开发者参与生态建设。对于中国游戏产业而言,这是一次缩小与海外技术差距的重要机会。
结语
腾讯混元3D世界模型2.0的发布与开源,标志着AI 3D生成技术从"生成图片或视频"进化到"生成可交互的3D世界"。对于游戏开发者、元宇宙建设者、数字孪生从业者而言,这是一款具有里程碑意义的工具。随着技术的进一步成熟和生态的完善,我们有理由期待,在不久的将来,"人人都能创造3D世界"将成为现实。
来源:IT之家(作者:浩渺)
