LongCat-Video-Avatar-美团开源的数字人视频生成模型

LongCat-Video-Avatar-美团开源的数字人视频生成模型

文章来源:智汇AI    发布时间:2025-12-18

LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频,保持人物身份一致性和自然动

暂无访问

LongCat-Video-Avatar是什么

LongCat-Video-Avatar 是美团 LongCat 团队推出的音频驱动角色动画模型。模型能生成超逼真、口型同步的长视频,保持人物身份一致性和自然动态。LongCat-Video-Avatar支持多种生成模式,包括音频文本生成视频(AT2V)、音频文本图像生成视频(ATI2V)和视频续写。通过解耦音频信号与动作、避免重复内容和减少 VAE 错误累积等技术,实现高质量、长时间的视频生成,可用于演员表演、歌手动态、播客、销售演示及多人互动场景。

LongCat-Video-Avatar

LongCat-Video-Avatar的主要功能

多模式视频生成:支持音频文本生成视频(AT2V)、音频文本图像生成视频(ATI2V)和视频续写,满足不同场景的多样化需求。

相关推荐