文章来源:智汇AI 发布时间:2025-08-05
FunAudioLLM是阿里巴巴通义实验室推出的开源语音大模型项目,包含SenseVoice和CosyVoice两个模型。SenseVoice擅长多语言语音识别
暂无访问FunAudioLLM是阿里巴巴通义实验室推出的开源语音大模型项目,包含SenseVoice和CosyVoice两个模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语言,特别在中文和粤语上表现优异。CosyVoice则专注于自然语音生成,能够控制音色和情感,支持中英日粤韩五种语言。FunAudioLLM适用于多语言翻译、情绪语音对话等场景。相关模型和代码已在Modelscope和Huggingface平台开源。


开发者和研究人员:使用FunAudioLLM进行语音识别、语音合成、情感分析等领域的研究和开发。企业用户:在客户服务、智能助手、多语言翻译等业务场景中应用FunAudioLLM,提高效率和用户体验。内容创作者:使用FunAudioLLM生成有声读物或播客,丰富内容形式,吸引更多听众。教育领域:用于语言学习、听力训练等教育应用,提高学习效率和兴趣。残障人士:帮助视障人士通过语音交互获取信息,提升生活便利性。