EzAudio-腾讯联合约翰霍普金斯大学推出的文本到音频生成模型

EzAudio-腾讯联合约翰霍普金斯大学推出的文本到音频生成模型

文章来源:智汇AI    发布时间:2025-07-28

EzAudio是由约翰霍普金斯大学和腾讯AI实验室共同推出的一款文本到音频(Text-to-Audio, T2A)生成模型。基于一种高效的扩散变换器技术,用在从

暂无访问

 EzAudio是什么

EzAudio是由约翰霍普金斯大学和腾讯AI实验室共同推出的一款文本到音频(Text-to-Audio, T2A)生成模型。基于一种高效的扩散变换器技术,用在从文本提示生成高质量的音频效果。EzAudio的创新之处在于优化的模型架构和数据高效训练策略,在生成速度、效率和音频真实感方面都达到新标准。EzAudio引入无分类器引导重缩放技术,简化模型使用保持音频质量。

EzAudio

相关推荐