文章来源:智汇AI 发布时间:2025-12-24
Fun-Audio-Chat是阿里云通义百聆团队开源的新一代端到端语音交互模型,具备语音理解、情感感知和任务执行能力。模型采用双分辨率设计,通过5Hz和25Hz
暂无访问Fun-Audio-Chat是阿里云通义百聆团队开源的新一代端到端语音交互模型,具备语音理解、情感感知和任务执行能力。模型采用双分辨率设计,通过5Hz和25Hz帧率协同工作,相比同类产品节省近50%GPU计算资源。核心创新在于Core-Cocktail两阶段训练策略,能有效避免灾难性遗忘,同时支持多语言语音翻译和角色扮演功能。在OpenAudioBench等国际评测中,本次开源的Fun-Audio-Chat-8B在语音对话、情感识别等任务上超越GLM4-Voice等竞品,已应用于智能客服、情感陪伴等场景,用户可通过ModelScope、HuggingFace平台免费下载使用。
