Nemotron Speech ASR-英伟达开源的语音识别模型

Nemotron Speech ASR-英伟达开源的语音识别模型

文章来源：智汇AI 发布时间：2026-01-14

Nemotron Speech ASR 是英伟达开源的专注于低延迟、实时流式语音识别的模型。通过缓存感知架构，将已处理的语音特征缓存，仅对新音频帧进行计算，实现

暂无访问

Nemotron Speech ASR是什么

Nemotron Speech ASR 是英伟达开源的专注于低延迟、实时流式语音识别的模型。通过缓存感知架构，将已处理的语音特征缓存，仅对新音频帧进行计算，实现单句转录锁定仅需24毫秒，有效解决了传统流式模型在长语音识别中的累积延迟问题。模型支持多档延迟模式（80ms、160ms、560ms、1.12s），可根据应用场景灵活调整，无需重新训练，适用于游戏语音、实时翻译、会议记录等多种场景。具备更高的吞吐量和更低的运行成本，端到端延迟控制在500毫秒以内，并原生支持标点符号和大小写。

Nemotron Speech ASR

Nemotron Speech ASR的主要功能

低延迟实时识别：专为低延迟、实时流式场景设计，单句转录锁定仅需24毫秒，几乎与人类神经反应速度相当，适用于对实时性要求极高的语音交互场景。

相关推荐

最新收录

OutfitsAI手机版ai工具

Outfit

FotoForensicsAIapp下载安装官方免费

FotoFo

超会ai人工智能软件下载

超会ai人工

Resoomer智能AI助手app下载

Resoom

AstrBotai下载官方免费

AstrBo

AIStudiosai人工智能下载手机版

AIStud

SharkFoto手机下载ai软件

SharkF

FisherAI最火的应用

Fisher

PixMiller人工智能免费版

PixMil

Chalk.ist智能AI助手app推荐

Chalk.

Designifyai人工智能下载免费版

Design

知料觅得ai人工智能app免费

知料觅得ai

InspireMusicai人工智能免费下载

Inspir

HaiperAI人工智能网页版

Haiper

Dewatermark.ai人工智能软件免费版

Dewate

百度橙篇ai人工智能在线问答入口

百度橙篇ai

MagicEraser.ProAI智能

MagicE

TopazPhotoAI智能下载版

TopazP

最新文章

Nemotron Speech ASR-英伟达开源的语音识别模型

Nemotr

FantasyWorld-高德地图联合北邮推出的3D世界建模框架

Fantas

Obsidian-skills-Obsidian推出的开源AI工具包

Obsidi

黄仁勋：AI不是泡沫将推动全球GDP增长到500万亿美元

黄仁勋：AI

Spirit-v1.5-千寻智能推出的具身智能基础模型

Spirit

玩AI太费钱 xAI一年烧掉540多亿元：马斯克仍将豪赌未来

玩AI太费钱

女娲智能体OS-首个产品级开源的通用智能体操作系统

女娲智能体O

张文宏：拒绝把AI引入医院病历系统医生需要训练专业诊断能力

张文宏：拒绝

Oh My OpenCode-AI编程助手增强插件，自动调度任务

Oh My

脉脉：字节等大厂年薪超百万急招新增AI岗位超10倍

脉脉：字节等

Engram-DeepSeek联合北大推出的条件记忆模块

Engram

彪悍Zen5＋AI！AMD彻底颠覆嵌入式处理器

彪悍Zen5

Baichuan-M3-百川智能开源的新一代医疗增强大语言模型

Baichu

国产全球最强医疗大模型Baichuan-M3发布：已超越GPT-5.2与人类医生

国产全球最强

MMSI-Video-Bench-上海AI Lab推出的空间智能视频基准

MMSI-V

戴尔高管：过度营销AI适得其反消费者其实并不买账

戴尔高管：过

Youtu-LLM-腾讯Youtu团队开源的轻量级语言模型

Youtu-

京东成立“变色龙业务部”：将推出全年龄段人群AI玩具

京东成立“变