文章来源:智汇AI 发布时间:2025-06-13
FishSpeech是FishAudio开发的文本转语音(TTS)解决方案。它提供先进的TTS功能并支持多种语言,完美支持中英日语言的开源TTS模型。
访问官网FishSpeech是FishAudio开发的文本转语音(TTS)解决方案。它提供先进的TTS功能并支持多种语言,完美支持中英日语言的开源TTS模型,语音处理接近人类水平,模型使用约十五万小时三语数据训练,对中文支持非常的完美。
模型版本:当前稳定版本为FishSpeech1.1.2,正在更新至1.2版本1。初始版本FishSpeechV1使用15万小时的英语、中文和日语音频数据进行训练。
许可:代码库根据BSD-3-Clause许可证发布,而模型根据CC-BY-NC-SA-4.0许可证发布。
在线演示:用户可以通过HuggingfaceSpaces和FishAudio2上提供的在线演示来尝试FishSpeech。
系统要求:对于推理,需要至少4GB内存的GPU,而微调则需要16GB的GPU内存。该系统同时支持Linux和Windows。
Windows设置:非专业Windows用户可以通过提供的批处理脚本(install_env.bat)安装环境。可以选择使用镜像站点下载依赖项并启用模型编译的编译环境。
致谢:FishSpeech的发展受到多个项目的影响,包括VITS2、Bert-VITS2、GPTVITS、MQTTS、GPTFast和GPT-SoVITS。
语音助手:FishSpeech可以集成到语音助手平台中,以多种语言提供听起来自然的响应,可以增强用户交互性和可访问性。
有声读物旁白:高质量的语音合成使FishSpeech适合生成书面内容的有声读物版本。
语言学习:鱼语音支持英语、中文和日语,可用于语言学习应用程序,通过生成目标语言的语音来帮助学生练习发音和听力技能。
辅助工具:FishSpeech可用于辅助工具中,通过将文本转换为语音来帮助视障用户。
客户服务机器人:与客户服务机器人集成可以通过自然的语音实现与客户交互。
内容创作:可以使用FishSpeech为视频、播客和其他多媒体内容生成画外音。
FishSpeech由fishaudio开发,作为一个仅有亿级参数的模型,FishSpeech的设计非常的轻量而且高效。它可以在个人设备上轻松运行和微调,很方便成为您的私人语音助手。
github代码:https://github.com/fishaudio/fish-speech
huggingface:https://huggingface.co/fishaudio/fish-speech-1.2