LongCat-Audio-Codec-美团开源的语音编解码方案

LongCat-Audio-Codec-美团开源的语音编解码方案

文章来源：智汇AI 发布时间：2025-10-27

LongCat-Audio-Codec 是美团 LongCat 团队开源的语音编解码方案，专为语音大语言模型（Speech LLM）设计。通过语义和声学双 To

暂无访问

LongCat-Audio-Codec是什么

LongCat-Audio-Codec 是美团 LongCat 团队开源的语音编解码方案，专为语音大语言模型（Speech LLM）设计。通过语义和声学双 Token 并行提取机制，兼顾语音的语义理解与声学特征保留，解决了传统方案中语义与声学信息难以平衡的问题。低延迟流式解码器支持实时交互，将解码延迟控制在百毫秒级，满足车载语音助手、实时翻译等场景的需求。具备超低比特率高保真与集成超分辨率设计，在极低比特率下实现高保真音频重建，同时提升输出音频的采样率和自然度。LongCat-Audio-Codec 提供了一站式的 Token 生成器与还原器工具链，支持灵活的码本配置，可根据下游任务调整码本数量，适应不同场景。其多阶段训练策略进一步优化了高压缩率和高音质的平衡。

LongCat-Audio-Codec

LongCat-Audio-Codec的主要功能

语义与声学并行 Token 化：将原始音频信号映射为语义与声学并行的 token 序列，兼顾语音的语义信息和声学特征。

相关推荐

最新收录

Ai艺术之家下载安装app

Ai艺术之家

即创AI下载app官方正版安装

即创AI下载

PromptDodo人工智能软件下载安装

Prompt

讯飞星火智能AI助手app版本

讯飞星火智能

猫目社区手机人工智能app

猫目社区手机

Perplexicaai人工智能软件免费

Perple

DescribePicai工具入口

Descri

MindSearch人工智能ai软件免费版

MindSe

QuickPromptAI最火的应用

QuickP

VideoDubbingai工具软件

VideoD

SeekAllAI人工智能ai软件免费版app官方

SeekAl

MyVocal.AI智能ai助手

MyVoca

AI快研侠ai人工智能免费版

AI快研侠a

VoiceEngine人工智能网页版

VoiceE

Samplette.ioai网页版本

Sample

音虫AiApp官方下载安装

音虫AiAp

ACEStudioAIApp下载安装

ACEStu

Voiceboxai智能下载安装

Voiceb

最新文章

LongCat-Audio-Codec-美团开源的语音编解码方案

LongCa

PaddleOCR-VL-百度飞桨开源的多模态文档解析模型

Paddle

Dexter-AI金融研究Agent，自动进行金融任务规划

Dexter

DeepSeek-OCR-DeepSeek团队开源的视觉语言模型

DeepSe

KoalaQA-开源AI售后服务社区，能7×24小时服务

KoalaQ

VitaBench-美团推出的大模型Agent评测基准

VitaBe

AipexBase-跨赴科技开源的首个AI原生后端服务平台

AipexB

Zen7 Payment Agent-Zen7 Labs开源的去中心化支付智能体

Zen7 P

混元世界模型1.1-腾讯混元开源的3D世界生成模型

混元世界模型

Seed3D 1.0-字节推出的3D生成大模型

Seed3D

蛐蛐 (QuQu)-开源的桌面端语音输入与文本处理工具

蛐蛐 (Qu

Baichuan-M2 Plus-百川智能推出的循证增强医疗大模型

Baichu

Nof1.ai交易提示词-为AI交易系统设计的模板

Nof1.a

MiniMax M2-MiniMax推出的Agent编程和优化模型

MiniMa

Kimi CLI-Moonshot AI推出的命令行通用智能体工具

Kimi C

摩尔线程、国家信息中心战略合作！国产GPU空前新机遇

摩尔线程、国

LongCat-Video-美团开源的AI视频生成模型

LongCa

NVIDIA未来将达10万亿美元市值：GPU血赚利润将达3750亿美元

NVIDIA