• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

谷歌Gemini发布最强TTS模型,用嘴"描述"就能控制语音情感

谷歌Gemini发布最强TTS模型,用嘴"描述"就能控制语音情感
AI TOP100
1小时前

谷歌憋了个大招,这次把语音的"控制权"交给了开发者

语音合成这件事,说起来很简单:输入文字,输出声音。但做好很难。

以前的TTS产品,生成出来的声音有个通病:听起来太"平"。语气平平的,节奏统一的,情绪几乎没有。你一听就知道这是机器在说,不是在"表达"。对于有声读物、播客这类需要情感的内容来说,这个缺点几乎是致命的。

谷歌这次在Gemini 3.1系列里推出的Gemini-TTS,想做的一件事就是解决这个问题。

工具地址:Gemini官网

gemini3.1 flash TTS

这次不一样在哪?

最大的突破是:把语音的控制权还给了开发者。

Gemini-TTS支持通过提示词直接调控语音的情感、节奏和风格。你可以用自然语言描述你要什么样的声音——

“旁白需要低沉庄重,像纪录片配音”;
“对话要轻松自然,像朋友在聊天”;
“停顿落在这里,情绪逐渐推向高潮”;

这些描述,Gemini-TTS能理解并生成对应的语音输出。

以往要精细控制TTS的输出,需要调各种参数——语速、音调、停顿间隔。普通人根本不知道怎么配,配出来的效果也参差不齐。Gemini-TTS把这事变成了"说你要什么"——你描述得越精确,生成的结果越接近你的想象。

多语言:约70种,一个API搞定

语言支持方面,Gemini-TTS覆盖约70种语言,中文普通话、英语、西班牙语、日语等主流语种都在列。

更贴心的是,它能自动识别输入文本的语种,不需要开发者手动标注。这意味着什么?做多语言内容的企业,以前需要针对每个语种单独对接API、单独调试。Gemini-TTS一套API就能搞定所有语种——有声读物要出中英日三语版本?一个接口,一个配置,全搞定。

对于有声读物、播客、客服机器人、教育应用这些需要大量语音内容的场景来说,这个效率提升是直接转化为成本的。

跟系列内其他模型怎么协同?

谷歌还特别强调了Gemini-TTS跟同系列音频模型的协同能力。

在实时对话、语音翻译和多模态交互场景中,系统可以在保持低延迟的同时,通过文本提示和音频标记对语音输出进行精细调控。翻译成人话就是:在电话、会议、导航这些"需要快速反应"的场景里,AI输出的语音能更接近真实人类的表达方式,而不是那种一听就是机器的"平板腔"。

我的判断

语音这事儿,谷歌这两年其实一直在布局,但声量不如语言模型那么大。Gemini-TTS的发布,说明语音在谷歌AI战略里的优先级在往上走。

从行业角度看,各家大厂在语言模型、图像生成上卷得很凶,但在语音领域的竞争烈度还没那么高。谷歌这次带着"迄今最富表现力"的定位入场,加上Gemini系列已有的生态优势,后续的冲击力不容小觑。

对于需要语音能力的企业来说,现在是个值得关注的时间节点——各家方案都在快速迭代,早点测试、早点落地,就能早点形成竞争力。


AITOP100-AI资讯频道将持续关注AI行业新闻资讯消息,带来最新AI内容讯息。

想了解AITOP100平台其它版块的内容,请点击下方超链接查看

AI创作大赛 | AI活动 | AI工具集 | AI资讯专区 | AI小说

AITOP100平台官方交流社群二维码:

AITOP100平台官方交流社群二维码二维码

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关AI工具
  • 谷歌Gemini
相关资讯
  • Adobe推出Firefly AI Assistant,这次要"直接接管"设计师的工作流

  • Midjourney V8.1重磅发布:原生2K高清渲染速度成本双降3倍

  • 微软图像生成模型MAI-Image-2-Efficient正式推出,速度提升22%,成本降低41%

  • Chrome技能库功能上线:Gemini提示词可一键复用,浏览器"操作系统化"再进一步

  • 不再是静态图了:Gemini的交互式可视化,能拆引擎也能看月球轨道

热点资讯

被全网刷屏的SBTI,背后没有心理学专家,只有一个想劝人戒酒的AI

5天前
被全网刷屏的SBTI,背后没有心理学专家,只有一个想劝人戒酒的AI

每日AI资讯-2026年4月08日

7天前
每日AI资讯-2026年4月08日

每日AI资讯-2026年4月09日

6天前
每日AI资讯-2026年4月09日

[AI漫剧城市沙龙·成都站]效能+精品抢跑AI漫剧下半场

1天前
[AI漫剧城市沙龙·成都站]效能+精品抢跑AI漫剧下半场

Genspark AI正式原生嵌入Office三件套:PPT/Excel/Word一键智能创作

6天前
Genspark AI正式原生嵌入Office三件套:PPT/Excel/Word一键智能创作
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有