微软公司在其Azure AI服务中发布了新一代高清语音模型,语音合成技术的又一重大进步!

微软公司在其Azure AI服务中发布了新一代高清语音模型,语音合成技术的又一重大进步!

2024-10-01 16:07:27

微软公司在其Azure AI服务中发布了新一代高清（HD）语音模型，标志着语音合成技术的又一重大进步。这项新技术基于先进的声学和语言特征分析，能够生成带有丰富自然变化的语音，自动根据文本中的情感线索调整语音的语调和风格，实现更像人类的自然语音模式。

Azure AI高清语音模型的特点

人类般的语音生成：新的高清语音模型能够准确解析输入文本，并理解文本背后的情感，实时调整语音的语调和情感表达，使生成的语音更具人情味和情境适应性。
对话风格增强：模型可以自然地模拟对话模式，包含常见的停顿、语气词和轻微的情感变化，使生成的语音听起来像是和人对话，而不是生硬的朗读文本。
韵律变化：系统通过引入细微的变化，使每次输出都更具自然感，避免每句话听起来都一模一样，从而让语音听起来更加逼真。
情境感知：能够自动感知文本中的情境和情感，并且在不需要手动干预的情况下调整语音的表达，使得每段生成的语音都与文本的上下文高度匹配。
多语言支持：支持超过500种神经语音，覆盖140多种语言和地区，特别适合应用在跨国业务、语言学习等需要多语言转换的场景。
易于集成和使用：用户可以使用与非高清语音相同的SDK和REST API来生成这些高清语音，从而轻松集成到现有的应用程序中。
实时交互：高清语音支持实时双向对话模式，可以用在虚拟助理、客户服务等应用中，提供更自然的交互体验。

这九款新语音现已在所有 Azure 地区上线

美式英语 - en-US-AvaMultilingualNeural：明亮、富有感染力的女性声音，音色优美。
美式英语 - en-US-AndrewMultilingualNeural：温暖、富有感染力的男性声音，让人感觉平易近人。
美式英语 - en-US-EmmaMultilingualNeural：友善、轻快、悦耳的女性声音，适用于教育和讲解场景。
美式英语 - en-US-BrianMultilingualNeural：年轻、开朗、多才多艺的声音，非常适合各种各样的环境。
德语 - De-DE-FlorianMultilingualNeural
德语 - De-DE-SeraphinaMultilingualNeural
法语 - Fr-FR-RemyMultilingualNeural
法语 - Fr-FR-VivienneMultilingualNeural
中文 - zh-CN-XiaoxiaoMultiligualNeural

此外，微软还宣布，“美式英语-RyanMultilingual” 语音现已在所有 Azure 地区上线。同时，公司将 “美式英语-JennyMultilingual” 合并为 “美式英语 - JennyMultilingualV2” 语音，并面向所有地区开放使用。

微软Azure AI的高清语音模型的发布，不仅提升了语音合成的自然度和准确性，还通过多语言支持和实时交互能力，拓宽了语音技术的应用场景。这项技术的发展，预示着未来人机交互将更加自然和无缝，为人工智能领域带来新的活力和可能性。

想了解更多AI行业资讯信息请关注AI人工智能网站--AITOP100平台--AI资讯专区：https://www.aitop100.cn/infomation/index.html

0

0

文章来源：AI TOP100

免责声明：本文不代表本平台立场，且不构成投资建议，请谨慎对待。

全部评论

暂无评论

热点资讯

每日AI资讯-2026年7月31日

每日AI资讯-2026年7月31日

全网爆火！豆包桌面宠物EXE完整制作教程（含万能提示词+避坑指南）

全网爆火！豆包桌面宠物EXE完整制作教程（含万能提示词+避坑指南）

每日AI资讯-2026年7月24日

每日AI资讯-2026年7月24日

每日AI资讯-2026年7月29日

每日AI资讯-2026年7月29日

FLUX 3正式发布：统一图像/音视频/机器人动作，20秒原生有声视频+工业具身智能双突破

FLUX 3正式发布：统一图像/音视频/机器人动作，20秒原生有声视频+工业具身智能双突破

分享

0

0

欢迎来到AI Top100！我们聚合全球500+款AI智能软件，提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台，让您轻松了解全球AI领域动态，并为您提供优质服务。

合作伙伴

联系我们

加入AITOP100社群

加入社群

AITOP100商务微信

商务微信

相关链接

服务及隐私政策