• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

重磅消息!GLM-ASR系列模型开源,智谱AI输入法惊艳登场

重磅消息!GLM-ASR系列模型开源,智谱AI输入法惊艳登场
AI TOP100
1小时前

智谱AI输入法

2025年12月10日,智谱在微信官方公众号发文宣布:智谱正式上线GLM-ASR系列语音识别模型,还推出了基于该系列模型打造的桌面端智谱AI输入法。这难道不意味着我们在语音交互领域又向前迈进了一大步吗?与传统的语音识别工具相比,智谱此次的新动作无疑是一场创新性的变革。

GLM-ASR系列模型:语音识别新标杆

云端与端侧的完美结合

GLM-ASR-2512是智谱新一代的云端语音识别模型。它就像一个超级“语音翻译官”,能将语音实时精准地转换为文字。在多场景、多语种、多口音的真实复杂环境测试中,它的表现堪称卓越,字符错误率(CER)仅为0.0717,稳稳处于行业领先地位。想象一下,无论你是在嘈杂的街头,还是和不同口音的人交流,它都能准确无误地识别你的语音,是不是超厉害?

而GLM-ASR-Nano-2512则是在GLM-ASR-2512基础上升级至的端侧模型。它虽然参数量仅1.5B,却取得了当前开源语音识别方向的SOTA表现,甚至在部分测试中还优于若干闭源模型。这就好比一个小巧玲珑却能量巨大的精灵,把强大的识别能力压缩到本地运行。这样一来,不仅隐私保护更强,交互延迟也更低,让你随时随地都能畅快使用语音识别功能。

GLM-ASR-Nano

与传统语音识别工具对比

对比项目 传统语音识别工具 GLM-ASR系列模型
识别精度 在复杂环境下识别错误率较高 多场景、多语种、多口音下字符错误率低
隐私保护 数据多上传至云端,隐私风险较大 端侧模型本地运行,隐私保护更强
交互延迟 受网络等因素影响,延迟较高 本地运行,交互延迟更低

智谱AI输入法:语音交互新体验

输入中的模型能力调用

智谱AI输入法基于GLM-ASR系列模型打造,让用户在电脑端用语音进行丝滑交互。传统输入法就像一个单纯的打字员,只负责把你说的话变成文字。而智谱AI输入法则是一个全能小助手,它不仅能实现精准的语音转文字,还能在输入法中直接调用大模型能力,完成翻译、改写、情绪转化等操作,真正实现了“指尖即模型,语音即指令”。

从听写到改写的一体化

智谱AI输入法实现了“所选即所改”,从听写到改写的一体化流程。它可以直接调用底层GLM模型,帮助用户翻译、扩写、精简屏幕上的任意一段文字,同时完成智能润色,让输出更加自然、通顺。整个过程都在输入框内完成,实现了“理解 - 执行 - 替换”一体化,无需在多个应用间反复切换。比如,你写了一段文字,觉得不够精彩,只需在输入法中简单操作,它就能帮你把文字变得更加生动有趣。

千人千面人设切换

智谱AI输入法还支持设置不同“人设”风格,实现同一句话在不同场景下的不同表达。想象一下,在工作场景中,你选择“面对老板”人设,原本口语化的碎碎念瞬间就能转化为逻辑严谨、条理清晰的工作汇报;在生活场景中,切换至“面对伴侣”人设,文字则变得温柔俏皮,贴近日常聊天语境。这就像给你配备了一个智能语言魔法师,能根据你的需求变换不同的语言风格。

Vibe Coding(语感编程)搭子

对于开发者来说,智谱AI输入法特别推出了Vibe Coding体验,并与智谱Coding Plan账号打通。结合多语言支持与代码理解能力,开发者可以通过语音快速输入代码逻辑和注释、查找遗忘的Linux指令、用自然语言指挥AI完成复杂数学计算或脚本编写。设计师也能从传统的“用手抠图”过渡到“用嘴做设计”,大大提高了工作效率。比如,设计师在构思一个设计方案时,只需用语音描述自己的想法,输入法就能快速生成相应的设计元素。

耳语捕捉与高效热词

在开放式办公室、图书馆等公共场景中,我们常常会因为不好意思大声说话而放弃语音输入。智谱AI输入法针对这一痛点,优化了对微弱声音的捕捉能力,并区分环境噪声。只需轻声说话,就能精准转为文字,解决了公共场合“不好意思用语音输入”的难题。同时,它还支持用户一键导入专属词汇、项目代号(如AutoGLM)及生僻人名、地名等。只需在设置中添加一次,后续使用就能更加便捷。

值得一提的是,随着AI技术的不断发展,语音交互已经成为未来科技的重要趋势。智谱此次推出的GLM-ASR系列模型和智谱AI输入法,无疑顺应了这一趋势,为用户带来了更加便捷、高效的语音交互体验。

体验与下载指南

现在,你可以在智谱开放平台bigmodel.cn调用最新的GLM-ASR-2512模型。同时,智谱为开源社区提供了1.5B的端侧模型GLM-ASR-Nano-2512,权重及推理代码均已发布。

即日起,智谱AI输入法面向所有用户开放,并免费提供2000积分,相当于28天使用时长。如果你想体验这款强大的输入法,Mac/Win用户可以访问下载链接:https://autoglm.zhipuai.cn/autotyper/ 。

相关链接

GLM-ASR-2512

  • 使用指南:https://docs.bigmodel.cn/cn/guide/models/sound-and-video/glm-asr-2512
  • 体验中心:https://bigmodel.cn/trialcenter/modeltrial/voice
  • 接口文档:https://docs.bigmodel.cn/api-reference/模型-api/语音转文本

GLM-ASR-Nano-2512

  • Hugging Face:https://huggingface.co/zai-org/GLM-ASR-Nano-2512
  • 魔搭社区:https://www.modelscope.cn/models/ZhipuAI/GLM-ASR-Nano-2512
  • 智谱AI输入法:Mac/Win访问下载:https://autoglm.zhipuai.cn/autotyper/

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

aitop100官方交流30群

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 智谱清言
相关资讯
  • 重磅消息!GLM-ASR系列模型开源,智谱AI输入法惊艳登场

  • OpenAI正式进军AI技能认证:教师版登陆Coursera,构建“学习-认证-求职”闭环

  • Netflix豪掷827亿收购华纳兄弟:娱乐行业变天,AI漫剧成新焦点

  • Google Doppl推出AI发现流:全视频购物新体验,重塑电商格局

  • 苹果STARFlow-V视频模型来袭,“归一化流”技术惊艳亮相

热点资讯

每日AI资讯-2025年12月01日

8天前
每日AI资讯-2025年12月01日

每日AI资讯-2025年12月02日

7天前
每日AI资讯-2025年12月02日

每日AI资讯-2025年12月09日

18小时前
每日AI资讯-2025年12月09日

来画发布全国首个支持1000秒AI漫剧平台,一键生成动漫短片

8天前
来画发布全国首个支持1000秒AI漫剧平台,一键生成动漫短片

每日AI资讯-2025年12月03日

6天前
每日AI资讯-2025年12月03日
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有