腾讯混元3D世界模型2.0开源:一句话造3D世界,无缝对接Unity与UE游戏引擎

👁️ 1750浏览 📅 2026-04-25

🔗腾讯混元3D 世界模型2.0开源:AI从"对话助手"进化为"世界创造者"

2026年4月16日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0),这是AI从"对话助手"进化为"世界创造者"的里程碑事件。过去,3D世界建模需要专业团队数周甚至数月的时间,而现在,只需输入文字、上传图片或视频,AI即可自动生成完整的3D世界,并可直接输出可编辑的3D资产文件,无缝对接Unity、UE等主流游戏引擎。

一、混元3D世界模型2.0的核心突破

版本对比 混元世界模型1.0 / Genie3等 混元世界模型2.0
输出格式 视频文件 可编辑的3D资产文件
游戏引擎对接 不支持 无缝对接Unity、UE等主流游戏引擎
内容形态 生成场景片段 生成包含人、物、景的完整3D世界

二、多模态输入能力

混元3D世界模型2.0支持多种类型的输入:

  • 文字输入:用自然语言描述你想要的3D世界,AI自动解析复杂语义,一键生成
  • 图片输入:上传参考图片,AI提取风格和元素,生成相似风格的3D世界
  • 视频输入:输入真实空间视频,AI复刻真实3D场景,构建数字孪生空间

三、3D资产生成与导出格式

混元3D世界模型2.0支持多种3D资产格式导出:

导出格式 适用场景
Mesh 通用3D模型格式,兼容大多数3D软件
3DGS(3D高斯泼溅) 高质量真实感渲染,可直接导入游戏引擎
点云 用于进一步处理或分析

关键优势:生成的3D资产可直接二次编辑,设计师可以在游戏引擎中对AI生成的世界进行精细调整,大幅提升游戏地图和关卡的制作效率。

四、风格自定义与角色交互

风格自定义

混元3D世界模型2.0支持多种风格输出:

  • 真实风:生成逼真的现实世界场景
  • 漫画风:生成二次元风格的3D世界
  • 游戏风:生成适合游戏使用的低多边形风格场景

角色交互模式

用户可操作角色在生成的3D场景中自由探索,具有物理碰撞效果。这一功能为游戏开发者提供了快速原型验证能力——在正式建模之前,即可测试关卡设计和游戏机制。

五、数字孪生构建能力

混元3D世界模型2.0在数字孪生领域也具有强大能力:

  • 输入真实空间视频或多视角图片
  • 可构建高精度数字孪生空间
  • 支持任意尺寸图像与视频输入
  • 一次性预测密集点云、多视角深度图、表面法线等

基于WorldMirror 2.0架构,混元3D世界模型2.0还配备了HY-WorldStereo新视角生成模型,可实现精确相机控制与细粒度视觉细节保持,空间一致性记忆机制确保新区域与已有区域完美衔接。

六、对游戏开发工作流的影响

传统游戏地图和关卡制作流程:

  1. 概念设计 → 2. 美术制作3D模型 → 3. 导入引擎搭建场景 → 4. 测试与迭代

这一流程通常需要数周甚至数月的时间,且需要专业的3D美术师参与。

混元3D世界模型2.0带来的变革:

  1. 输入文字/图片/视频 → 2. AI生成3D世界 → 3. 导入引擎二次编辑 → 4. 完成

整个流程可缩短至数小时,且对3D美术技能的要求大幅降低。这将使得更多独立游戏开发者能够创造出高质量的游戏世界。

七、开源意义与生态建设

腾讯将混元3D世界模型2.0正式开源,提供:

  • 完整的模型权重与代码
  • 详细的技术报告
  • 在线体验申请入口

开源策略将加速AI 3D生成技术的普及,吸引更多开发者参与生态建设。对于中国游戏产业而言,这是一次缩小与海外技术差距的重要机会。

结语

腾讯混元3D世界模型2.0的发布与开源,标志着AI 3D生成技术从"生成图片或视频"进化到"生成可交互的3D世界"。对于游戏开发者、元宇宙建设者、数字孪生从业者而言,这是一款具有里程碑意义的工具。随着技术的进一步成熟和生态的完善,我们有理由期待,在不久的将来,"人人都能创造3D世界"将成为现实。

来源:IT之家(作者:浩渺)

📚 想系统学习AI建模+3D打印?

18节实战课程,从想法到实物全流程跑通,零基础也能轻松学会!

立即学习 →