支持消费级显卡部署:腾讯混元3D世界模型宣布推出Lite版本,推理速度提升3倍以上且精度损失<1%

支持消费级显卡部署:腾讯混元3D世界模型宣布推出Lite版本,推理速度提升3倍以上且精度损失<1%

文章来源:智汇AI    发布时间:2025-08-21

腾讯今日宣布,混元团队推出 Lite 版本,大幅降低运行显存开销,支持消费级显卡部署。

暂无访问

智汇AI8月15日消息,腾讯今日宣布,混元团队推出Lite版本并开源,通过引入动态FP8量化,将模型显存需求从原本的26GB优化至17GB以下,成功适配消费级显卡。

同时,通过引入FP8量化注意力算子,混元团队将Transformer中的Q、K、V矩阵量化INT8,同时结合动态平滑与硬件优化,实现推理速度提升3倍以上,精度损失<1%。结合Attention量化和线性层量化后显著降低模型运行所需显存。

除显存方面外,混元团队还集成了Cache算法,通过优化冗余时间步,显著提升推理效率,让模型运行更加流畅。通过自动化搜参工具识别出关键时间步和block,优化冗余时间步,显著提升推理效率,让模型运行更加流畅。

除了清晰的视觉质量以及更低的推理成本,区别于业界已有方法,混元3D世界模型1.0不仅能生成“可看”的场景,更进一步实现了对场景中的天空、地面、植被、物体等不同组件分层建模。并且生成的世界可导出为3Dmesh格式文件,无缝接入游戏、物理引擎,进行二创,如游戏开发、影视制作、物理仿真等。

腾讯混元3D世界模型1.0,是业界首个开源可编辑的世界生成模型,用户只需输入一句话或上传一张图片,就能生成一个完整、可漫游的3D世界,这一创新不仅降低了3D内容创作的门槛,也为游戏开发、VR、数字内容创作等领域带来了全新的可能性。

通过结合全景生成与层次化3D重建等技术,混元3D世界模型1.0同时支持文字或者图片输入,实现了可交互、可编辑、高质量的360度可漫游场景生成。混元3D世界模型的技术亮点在于其全方位的场景生成能力和高度的可编辑性。通过层次化3D场景表征及生成算法,该模型支持3DMesh导出,在保证生成场景的逼真度和沉浸感的同时,兼容已有CG管线进行二次开发,如游戏开发、物理仿真、场景编辑等。

自发布以来,混元3D世界模型1.0在社区中备受关注,其卓越的世界生成能力为用户带来了全新AI体验。然而,显存开销大的问题是用户反馈的最大痛点,即使开启pipelineoffloading(流水线卸载)技术,仍需26GB以上显存,大多数消费级显卡无法运行。

为了让更多中小企业及个人开发者能够便捷使用混元3D世界模型1.0,混元团队推出了混元3D世界模型1.0-Lite版本,让消费级显卡也能跑世界模型。

下面是混元世界模型1.0-Lite消费级显卡运行效果:

可漫游场景效果(消费级显卡运行):

量化前后效果对比:

原始效果(HYWorld1.0)量化后效果(HYWorld1.0-Lite)原始效果(HYWorld1.0)量化后效果(HYWorld1.0-Lite)

智汇AI附官方地址:

官网地址:https://3d.hunyuan.tencent.com/sceneTo3D

Github项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0

HuggingFace模型地址:https://huggingface.co/tencent/HunyuanWorld-1

技术报告地址:https://arxiv.org/abs/2507.21809

相关推荐