VibeVoice-ASR-微软开源的长音频语音识别模型

VibeVoice-ASR-微软开源的长音频语音识别模型

文章来源：智汇AI 发布时间：2026-01-23

VibeVoice-ASR 是微软开源的先进语音识别模型，专为处理长达60分钟的长音频设计。模型能一次性处理整段音频，保持全局上下文，避免传统模型分段处理导致的

暂无访问

VibeVoice-ASR是什么

VibeVoice-ASR 是微软开源的先进语音识别模型，专为处理长达60分钟的长音频设计。模型能一次性处理整段音频，保持全局上下文，避免传统模型分段处理导致的上下文丢失。模型生成的转录文本包含语音内容，能标注说话者身份和时间戳，支持用户添加自定义热词，提高特定领域的识别准确性。VibeVoice-ASR 强大的功能使模型在长音频转录和多说话者场景中表现出色，广泛应用于会议记录、讲座转录等场景。

VibeVoice-ASR

VibeVoice-ASR的主要功能

长音频单次处理：模型支持长达60分钟的音频输入，一次性处理整段音频，保持全局上下文，避免分段处理导致的上下文丢失。

相关推荐

最新收录

imgAK

imgAK

33字幕图手机免费的ai下载

33字幕图手

ProductPics.AiAI智能app下载最新版本

Produc

302.AI智能助手app下载

302.AI

MoneyPrinterai人工智能免费软件下载

MoneyP

MediaGo人工智能ai下载

MediaG

FireShot智能AI助手app推荐

FireSh

ArtHub.AI下载安装app

ArtHub

Resonaai人工智能软件

Resona

Soraai人工智能软件免费

Soraai

Midscene.jsAI智能app

Midsce

博查AI搜索AiApp官方下载安装

博查AI搜索

壁纸样机神器ai工具免费下载

壁纸样机神器

PhotorAI免费下载

Photor

LogoDiffusionai智能app下载

LogoDi

Snipasteai助手免费版在线使用

Snipas

小微助手ai人工智能官方网站

小微助手ai

KerquAiAIApp官方正版下载

KerquA

最新文章

VibeVoice-ASR-微软开源的长音频语音识别模型

VibeVo

美国AI财大气粗国产AI学不了：Kimi仅用了1%算力就超越主流闭源

美国AI财大

Being-H0.5-卢宗青团队开源的通用机器人模型

Being-

34GB大礼包 AMD显卡AI生产力来了：ComfyUI等5大软件一键部署

34GB大礼

LightOnOCR-2-1B-LightOnAI推出的OCR模型

LightO

57.1%的人分不清真假！Runway新视频模型太爆炸

57.1%的

TranslateGemma-谷歌开源的系列翻译模型

Transl

FLUX.2 [klein]-Black Forest Labs开源的图像生成模型

FLUX.2

AgentCPM-Explore-清华联合面壁智能开源的智能体模型

AgentC

股神巴菲特再次示警：AI的危险不亚于核武器

股神巴菲特再

ArenaRL-通义与高德开源的开放域对比式强化学习方法

ArenaR

深陷色情内容争议 X终于出手 Grok禁止生成真人比基尼照

深陷色情内容

Step-Audio-R1.1-阶跃星辰开源的原生语音推理模型

Step-A

千问App接入淘宝、闪购！全球首发AI购物功能

千问App接

GLM-Image-智谱联合华为开源的多模态图像生成模型

GLM-Im

VidBee-开源音视频下载工具，支持YouTube、Bilibili平台

VidBee

BabyVision-UniPat AI团队推出的多模态理解评测集

BabyVi

PixVerse R1-爱诗科技推出的全球首个通用实时世界模型

PixVer