• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
  • AI漫剧创作
AI 对话

谷歌Gemini发布最强TTS模型,用嘴"描述"就能控制语音情感

谷歌Gemini发布最强TTS模型,用嘴"描述"就能控制语音情感
AI TOP100
2026-04-16 13:27:36

谷歌憋了个大招,这次把语音的"控制权"交给了开发者

语音合成这件事,说起来很简单:输入文字,输出声音。但做好很难。

以前的TTS产品,生成出来的声音有个通病:听起来太"平"。语气平平的,节奏统一的,情绪几乎没有。你一听就知道这是机器在说,不是在"表达"。对于有声读物、播客这类需要情感的内容来说,这个缺点几乎是致命的。

谷歌这次在Gemini 3.1系列里推出的Gemini-TTS,想做的一件事就是解决这个问题。

工具地址:Gemini官网

gemini3.1 flash TTS

这次不一样在哪?

最大的突破是:把语音的控制权还给了开发者。

Gemini-TTS支持通过提示词直接调控语音的情感、节奏和风格。你可以用自然语言描述你要什么样的声音——

“旁白需要低沉庄重,像纪录片配音”;
“对话要轻松自然,像朋友在聊天”;
“停顿落在这里,情绪逐渐推向高潮”;

这些描述,Gemini-TTS能理解并生成对应的语音输出。

以往要精细控制TTS的输出,需要调各种参数——语速、音调、停顿间隔。普通人根本不知道怎么配,配出来的效果也参差不齐。Gemini-TTS把这事变成了"说你要什么"——你描述得越精确,生成的结果越接近你的想象。

多语言:约70种,一个API搞定

语言支持方面,Gemini-TTS覆盖约70种语言,中文普通话、英语、西班牙语、日语等主流语种都在列。

更贴心的是,它能自动识别输入文本的语种,不需要开发者手动标注。这意味着什么?做多语言内容的企业,以前需要针对每个语种单独对接API、单独调试。Gemini-TTS一套API就能搞定所有语种——有声读物要出中英日三语版本?一个接口,一个配置,全搞定。

对于有声读物、播客、客服机器人、教育应用这些需要大量语音内容的场景来说,这个效率提升是直接转化为成本的。

跟系列内其他模型怎么协同?

谷歌还特别强调了Gemini-TTS跟同系列音频模型的协同能力。

在实时对话、语音翻译和多模态交互场景中,系统可以在保持低延迟的同时,通过文本提示和音频标记对语音输出进行精细调控。翻译成人话就是:在电话、会议、导航这些"需要快速反应"的场景里,AI输出的语音能更接近真实人类的表达方式,而不是那种一听就是机器的"平板腔"。

我的判断

语音这事儿,谷歌这两年其实一直在布局,但声量不如语言模型那么大。Gemini-TTS的发布,说明语音在谷歌AI战略里的优先级在往上走。

从行业角度看,各家大厂在语言模型、图像生成上卷得很凶,但在语音领域的竞争烈度还没那么高。谷歌这次带着"迄今最富表现力"的定位入场,加上Gemini系列已有的生态优势,后续的冲击力不容小觑。

对于需要语音能力的企业来说,现在是个值得关注的时间节点——各家方案都在快速迭代,早点测试、早点落地,就能早点形成竞争力。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流社群二维码二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 谷歌Gemini
相关资讯
  • 谷歌Gemini 3.5 Live Translate发布:延迟同传、音色还原、多语言自动识别

  • Anthropic推出Claude Fable 5和Claude Mythos 5两款全新大模型,性能远超竞品模型

  • 全球每3个人就有1个在用!谷歌AI搜索破25亿月活,Gemini一年用户翻倍,全生态打法改写全球AI格局

  • 从代码工具变身全能职场助手!OpenAI Codex重磅更新,6大岗位插件打通全行业办公链路

  • 时薪最高304元、全球远程!xAI急招中文AI训练师,Grok语音能力大升级

热点资讯

方特帧美剧场首部剧集《我在末世卖炒粉,凶兽全到锅里来》先导预告重磅发布

3天前
方特帧美剧场首部剧集《我在末世卖炒粉,凶兽全到锅里来》先导预告重磅发布

小米MiMo Code开源发布:终端AI编程助手实测性能超越Claude Code

2天前
小米MiMo Code开源发布:终端AI编程助手实测性能超越Claude Code

AIGC大赛:抖音AI创作大赛,总奖池超400万!

2天前
AIGC大赛:抖音AI创作大赛,总奖池超400万!

每日AI资讯-2026年6月10日

2天前
每日AI资讯-2026年6月10日

Kimi推出全球首张AI原生信用卡:每一笔消费均可转化为AI算力额度,已开放预约

19小时前
Kimi推出全球首张AI原生信用卡:每一笔消费均可转化为AI算力额度,已开放预约
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有