文章来源:智汇AI 发布时间:2026-01-23
NovaSR 是开源的音频超分辨率模型,仅有 52KB 能将 16kHz 的低采样率音频(如电话音质)提升到 48kHz 的高采样率音频(如录音室级音质)。模型
暂无访问NovaSR 是开源的音频超分辨率模型,仅有 52KB 能将 16kHz 的低采样率音频(如电话音质)提升到 48kHz 的高采样率音频(如录音室级音质)。模型通过神经网络预测并生成高频信息,实现音质的显著改善。NovaSR 的处理速度极快,单张 A100 GPU 可达 3600 倍实时,模型小巧,可嵌入端侧设备,如 TWS 耳机芯片。NovaSR适用语音修复、TTS 输出增强、实时通信等场景,展现小模型在音频处理领域的巨大潜力。
