AI语言翻译

星火纪要

星火纪要,科大讯飞推出的一款基于先进语音识别技术和大模型的会议交流总结和分析平台,具有高效转录、智能总结、翻译、数据分析等功能。

星声AI播客

星声AI播客,专注于AI播客领域的AI播客生成器,面向广大播客爱好者和音频内容分享使用者。

YuE

YuE,一个全新的多模态音乐开源模型,YuE具有从歌词生成高质量音乐的能力。能够生成长达5分钟的完整音乐作品,包括人声和伴奏,支持多种语言生成。

kokoroTTS

kokoroTTS,一款开源、高性能的文本转语音(TTS)模型,Kokoro TTS拥有8200万参数,基于StyleTTS 2架构,提供高质量、自然的语音合成,适用于有声书、播客等。

PengChengStarling

PengChengStarling,鹏城实验室开源的一款多语言语音识别系统开发工具包,PengChengStarling可以在统一的框架内处理多种语言语音输入,支持实时语音识别,边说边识别。

FUZZ

FUZZ,由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。

FishAudio

FishAudio,一个在线AI文本转语音合成配音声音克隆平台,以其自然、富有表现力的语音生成技术,为用户带来了前所未有的音频体验。

优雅AI创作平台

优雅AI创作平台,中科闻歌发布的一款多模态内容智能生成平台,用户只需输入关键词或简单指令,能够自动生成文本、图片、音视频等多种形式的内容。

Spark-TTS

Spark-TTS,SparkAudio团队开发的文本转语音(TTS)系统,基于 Qwen2.5 构建, 能够生成自然、高质量的语音。并支持零样本语音克隆和多语言合成。

NotaGen

NotaGen,由中央音乐学院、北京航空航天大学和清华大学等机构联合开发的一款 AI 音乐生成模型,专注于生成高质量的古典乐谱。