HY-Motion 1.0-腾讯混元开源的文本到3D动作生成大模型

HY-Motion 1.0-腾讯混元开源的文本到3D动作生成大模型

文章来源:智汇AI    发布时间:2026-01-07

HY-Motion 1.0(混元Motion 1.0)是腾讯混元团队开源的十亿参数级文本到 3D 动作生成大模型。基于 Diffusion Transforme

暂无访问

HY-Motion 1.0是什么

HY-Motion 1.0(混元Motion 1.0)是腾讯混元团队开源的十亿参数级文本到 3D 动作生成大模型。基于 Diffusion Transformer(DiT)架构与流匹配机制,仅需一句自然语言描述,能生成高保真、流畅多样的 3D 角色骨骼动画。模型采用全阶段训练策略,包括在超 3000 小时多样化动作数据上预训练、在 400 小时精选高质量数据上微调,以及通过强化学习结合人类反馈和奖励模型进行优化。覆盖 6 大类超 200 种动作,输出为 SMPL-H 骨骼格式,支持原子动作、组合序列及并发动作生成。在性能评估中,指令遵循能力达 78.6%,动作质量平均 3.43 分(5 分制),全面超越 MoMask、DART 等开源基线。

HY-Motion 1.0

HY-Motion 1.0的主要功能

文本驱动动作生成:通过自然语言描述直接生成高质量的3D骨骼动画,实现从文本到动作的高效转化。

相关推荐