• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

阿里发布Qwen3-TTS语音合成模型:支持49种音色与零样本调用

阿里发布Qwen3-TTS语音合成模型:支持49种音色与零样本调用
AI TOP100
6小时前

在人工智能技术飞速发展的今天,语音合成技术(TTS)正经历着从“可听懂”到“可角色化”的深刻变革。

2025年12月07日,阿里巴巴正式推出了其Qwen3家族的最新力作——Qwen3-TTS,这款主打“零样本、多角色、跨语言”的语音合成模型,不仅在技术上实现了重大突破,更在应用场景上展现了无限可能,为语音合成领域注入了新的活力。

模型地址:阿里Qwen3-TTS语音合成模型

阿里发布Qwen3-TTS语音合成模型

一、Qwen3-TTS:技术革新,性能卓越

Qwen3-TTS的推出,标志着语音合成技术进入了一个全新的阶段。该模型在词错误率(WER)这一国际基准上,显著优于主流商用引擎,展现了其强大的技术实力。具体而言,在多语言语音合成公开测试集(MLS + Common Voice)上,Qwen3-TTS的英文WER降至2.8%,中文更是低至1.9%,较Azure TTS等主流商用模型分别降低了18%和24%,刷新了开源SOTA(State-of-the-Art)记录。

这一卓越性能的背后,是Qwen3-TTS采用的自回归声学模型与韵律预测模块的完美结合。该模型能够根据文本中的标点、情感标签等元素,自动调整语调、插入停顿,实现文本到语气、节奏的全自动“拟人化”转换。在48kHz的高采样率下,Qwen3-TTS的MOS(Mean Opinion Score)得分高达4.53,远超行业平均的4.1,为用户提供了更加自然、流畅的语音体验。

二、49种音色,一键切换角色

Qwen3-TTS的另一大亮点在于其内置的49种高品质音色。从温柔少女到方言大叔,从旁白到客服,从直播到教育,这些音色覆盖了多种场景,满足了用户多样化的需求。更重要的是,Qwen3-TTS支持同一文本在多种音色间的秒级切换,无需重新训练,极大地提高了语音合成的灵活性和效率。

此外,Qwen3-TTS还支持10种语言和9种中国方言(包括粤语、四川话、东北话等),使得语音合成不再受限于语言和地域,真正实现了跨语言的交流与沟通。这一特性对于全球化应用和多语言教育场景来说,无疑具有巨大的价值。

三、教育场景“零样本”落地,助力家乡话学习

Qwen3-TTS不仅在技术上领先,更在实际应用中展现了其强大的落地能力。阿里云同步发布了“一键朗读”插件,教师只需上传PPT,即可自动生成带方言的讲解音频。这一功能目前已在上海120所中小学试点,帮助学生用“家乡话”听写单词,不仅提高了学生的学习兴趣,也促进了方言文化的传承与发展。

这种“零样本”的落地方式,意味着用户无需进行复杂的模型训练和调优,即可直接使用Qwen3-TTS进行语音合成,大大降低了技术门槛和应用成本。这对于直播、客服、教育等场景来说,无疑是一个巨大的福音。

四、定价亲民,入口便捷

为了满足不同用户的需求,Qwen3-TTS提供了灵活的定价策略。免费层用户每月可享受100万字符的合成额度,且49种音色不限调用;付费层则按0.8元/万字符计费,同时支持SSML(Speech Synthesis Markup Language)与实时流式合成,满足用户更加复杂和高级的需求。

用户只需登录阿里云控制台(console.aliyun.com),进入“人工智能”-“语音合成”-“Qwen3-TTS”页面,即可轻松使用这一强大的语音合成工具。目前,Qwen3-TTS已全量上线,等待您的探索与体验。

五、未来发展:音色克隆与超采样版本即将来袭

阿里透露,2025年第一季度将开放“10秒音色克隆”接口。用户只需上传一段短音频,即可生成私有说话人,实现个性化的语音合成。这一功能将极大地丰富语音合成的应用场景,如虚拟偶像、播客、有声书等,为用户提供更加多样化和个性化的选择。

同时,阿里还将推出80kHz超采样版本的Qwen3-TTS,进一步提升语音合成的音质和细节表现。这一版本将瞄准播客、有声书与虚拟偶像等高端市场,为用户提供更加极致的语音体验。

结语:语音合成的新篇章,由Qwen3-TTS开启

Qwen3-TTS的推出,不仅标志着语音合成技术的一次重大突破,更开启了语音合成领域的新篇章。从技术革新到应用落地,从多角色切换到跨语言交流,Qwen3-TTS以其卓越的性能和灵活的应用方式,为语音合成领域注入了新的活力。

随着音色克隆和超采样版本的即将发布,我们有理由相信,语音生成将进入一个“人人都能配旁白”的新阶段。让我们共同期待Qwen3-TTS在未来的精彩表现吧!


想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码:

aitop100官方交流30群

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 米哈游联创蔡浩宇新动作:“喵系”AI AnuNeko惊艳登场

  • 快手可灵AI推出“主体库”功能,为视频生成赋予角色一致性

  • AI视频生成工具OiiOii开启二轮内测,邀请码规则与积分模式全面升级

  • 阿里发布Qwen3-TTS语音合成模型:支持49种音色与零样本调用

  • 腾讯混元2.0正式上线,推理效率领跑!DeepSeek V3.2同步接入

热点资讯

每日AI资讯-2025年12月01日

7天前
每日AI资讯-2025年12月01日

每日AI资讯-2025年12月02日

6天前
每日AI资讯-2025年12月02日

来画发布全国首个支持1000秒AI漫剧平台,一键生成动漫短片

7天前
来画发布全国首个支持1000秒AI漫剧平台,一键生成动漫短片

每日AI资讯-2025年12月03日

5天前
每日AI资讯-2025年12月03日

AI视频生成工具OiiOii开启二轮内测,邀请码规则与积分模式全面升级

5小时前
AI视频生成工具OiiOii开启二轮内测,邀请码规则与积分模式全面升级
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有