Gemini TTS-谷歌推出的AI文本转语音模型

Gemini TTS-谷歌推出的AI文本转语音模型

文章来源:智汇AI    发布时间:2025-12-14

Gemini TTS 是谷歌推出的先进文字转语音技术,最新版本为 Gemini 2.5 Flash 和 Pro 模型。支持多说话人、多语言(24种以上)合成,可

暂无访问

Gemini TTS是什么

Gemini TTS 是谷歌推出的先进AI文字转语音技术,最新版本为 Gemini 2.5 Flash 和 Pro 模型。支持多说话人、多语言(24种以上)合成,可生成自然流畅且富有情感的语音。用户可通过自然语言指令精确控制语音的风格、语速、语调和情感表达。Gemini TTS 提供低延迟的语音合成,适合日常应用和专业场景,如播客、有声读物和语音助手。最新的更新增强了语音的表达力、语速控制和多说话人对话的一致性。

Gemini TTS

Gemini TTS的主要功能

多说话人语音生成:能在一个音频文件中合成多个不同的说话人声音,使对话和戏剧等场景更加生动。

相关推荐