GLM-ASR-智谱开源的语音识别系列模型

GLM-ASR-智谱开源的语音识别系列模型

文章来源：智汇AI 发布时间：2025-12-11

GLM-ASR是智谱AI推出的系列语音识别模型，包括云端的GLM-ASR-2512和开源的GLM-ASR-Nano-2512。GLM-ASR-2512是全球领先

暂无访问

GLM-ASR是什么

GLM-ASR是智谱推出的语音识别模型系列，包括云端的GLM-ASR-2512和开源的GLM-ASR-Nano-2512。GLM-ASR-2512是全球领先的云端语音识别模型，支持多场景、多语种、多口音，字符错误率仅为0.0717。GLM-ASR-Nano-2512是1.5B参数的端侧模型，性能达到开源领域SOTA，支持方言识别、低音量语音捕捉，兼顾隐私保护和低延迟。基于此模型，智谱AI输入法可实现语音转文字、翻译、改写等功能，推动语音交互向高效、智能方向发展。

GLM-ASR

GLM-ASR的主要功能

精准语音转文字：模型能将语音实时转换为文字，支持多场景、多语种和多口音，字符错误率低，确保高精度识别。方言与低音量识别：模型优化了对粤语等方言的支持，在低音量（如耳语）场景下能准确捕捉和转录语音。端侧隐私保护：GLM-ASR-Nano-2512可在本地运行，无需上传语音数据到云端，保护用户隐私，同时降低交互延迟。智能交互与功能拓展：基于GLM-ASR的智谱AI输入法支持翻译、改写、情绪转化等操作，提供“人设”切换功能，适应不同场景的表达需求。开发者支持：为开发者提供“语感编程”功能，支持通过语音输入代码逻辑和注释，查找指令，完成复杂数学计算或脚本编写。专属词汇定制：用户能导入专属词汇、项目代号、生僻人名和地名等，提升特定领域的识别准确率。

GLM-ASR的性能表现

GLM-ASR-2512：在多场景、多语种、多口音的复杂环境中，字符错误率（CER）仅为0.0717，处于行业领先水平。

相关推荐

最新收录

LogoSymbolai人工智能下载安装

LogoSy

Artimator.Ioai人工智能问答免费入口

Artima

Vidu手机免费AI工具

Vidu手机

CompumuseumAIAPP免费版下载

Compum

天壤万卷ai在线问答

天壤万卷ai

MultiPostAI智能app官方下载

MultiP

扑奔PPT免费字体ai人工智能下载安装

扑奔PPT免

6penArtai下载手机版

6penAr

巧手打字通人工ai智能软件

巧手打字通人

Reddit翻译助手人工智能ai软件免费版app

Reddit

字客网智能ai软件

字客网智能a

UberduckAI智能AI助手app推荐

Uberdu

快手可图ai正版下载

快手可图ai

AIShort下载Ai

AIShor

AI速配下载ai智能软件并安装

AI速配下载

OurBabyAiai人工智能免费软件

OurBab

FaceAiSwapai工具下载安卓

FaceAi

字体松鼠下载AI正版

字体松鼠下载

最新文章

GLM-ASR-智谱开源的语音识别系列模型

GLM-AS

比尔·盖茨谈AI泡沫：相当一部分公司估值并不合理

比尔·盖茨谈

Mistral Vibe CLI-Mistral AI推出的开源命令行代码助手

Mistra

构建高效网页的基础指南与INDEX.HTML的核心作用解析

构建高效网页

斩首工具的历史演变及其对社会影响的深刻分析

斩首工具的历

免费高清视频录像工具软件推荐轻松录制高清画面与声音

免费高清视频

时空之轮2道具详解：分类、获取与使用技巧全攻略

时空之轮2道

想要畅享精彩直播？来试试樱花直播apptv版吧！

想要畅享精彩

一场关于人类未来的思考：末世启示录

一场关于人类

让我们一起去感受柑橘味香气在线观看的乐趣吧！

让我们一起去

日剧《轮到你了》第二季在线观看带你走入悬疑与人性的深渊之旅

日剧《轮到你

揭秘澳门一码一肖一特一中TA几SI的神秘魅力与独特玩法分析

揭秘澳门一码

手机版《我的世界》附魔书使用攻略：获取、效果与优化技巧

手机版《我的

你知道新版猫咪现在在哪里吗？新版猫咪目前的地址

你知道新版猫

久久精品国产亚洲AV无码85的使用技巧与应用场景详解，助你提升使用体验与效果

久久精品国产

《朋友的未婚妻》中字揭示的爱情故事与人生抉择解析

《朋友的未婚

健身私教的真实情况其实是这样，很多健身私教是0

健身私教的真

《天堂に駆ける向天堂奔去歌词深度解析与感人解读》

《天堂に駆け