FireRedTTS-2-小红书推出的流式文本转语音系统

FireRedTTS-2-小红书推出的流式文本转语音系统

文章来源:智汇AI    发布时间:2025-09-15

FireRedTTS-2 是先进的长格式流式文本转语音(TTS)系统,专注于多说话人对话生成。采用12.5Hz流式语音分词器和双Transformer架构,能实

暂无访问

FireRedTTS-2是什么

FireRedTTS-2 是先进的长格式流式文本转语音(TTS)系统,专注于多说话人对话生成。采用12.5Hz流式语音分词器和双Transformer架构,能实现低延迟、高保真、多语言的语音合成。支持英语、中文、日语、韩语、法语、德语和俄语等多种语言,具备零样本跨语言及语码转换语音克隆能力。目前支持4个说话人的3分钟对话生成,可以通过扩展训练语料进一步延长对话时长和增加说话人数量。在播客生成和聊天机器人集成方面表现出色,提供稳定、自然的语音输出,可以根据上下文生成富有情感的语音。

FireRedTTS-2

FireRedTTS-2的主要功能

长对话语音生成:支持4个说话人的3分钟对话生成,可扩展训练语料以增加对话时长和说话人数量。

相关推荐