
2025年10月28日,AI语音领域迎来“王炸级”突破——Soul推出的SoulX-Podcast语音模型正式上线,凭借90分钟超长对话生成、中英双语+方言无缝融合等硬核功能,成为播客创作者的“新宠”。它不仅解决了AI语音“短时演示”的痛点,更让多语种、个性化播客制作变得像“拼乐高”一样简单。当AI能连续唠嗑一个半小时不卡壳,甚至模仿名人语气主持节目,传统录音棚是不是该慌了?

90分钟超长输出,AI也能“唠”到停不下来
传统AI语音模型生成长内容时,总像“电量不足”——声音卡顿、情感生硬,甚至中途“掉线”。但SoulX-Podcast直接打破这一魔咒:它能连续生成90分钟以上的对话,且稳定性零衰减,输出流畅得像真人聊天。
对比传统模型,SoulX-Podcast强在哪?
| 维度 | 传统AI语音模型 | SoulX-Podcast |
|---|---|---|
| 连续生成时长 | 通常不超过10分钟 | 90分钟+超长输出 |
| 稳定性 | 生成越长,卡顿概率越高 | 全程流畅,无衰减 |
| 适用场景 | 短音频演示、广告配音 | 长篇播客、访谈、故事讲述 |
无论是深夜电台的长篇故事,还是嘉宾访谈的深度对话,SoulX-Podcast都能轻松hold住。有测试用户调侃:“用它做播客,连主持人都不用请,AI能自己聊完一整期!”
中英双语+方言自由切换,语音也能混搭风
更让人惊喜的是,SoulX-Podcast的语言能力堪称“语言大师”。它不仅支持普通话、英语,还能无缝融入四川话、粤语等中文方言。更绝的是,用户可以在对话中自由切换中英文,甚至插入方言元素——比如用四川话讲段子,突然切回英语聊国际新闻,再补一句粤语金句,播客氛围瞬间拉满。
除此之外,模型还具备“副语言控制”功能,能精准模拟笑声、叹气、停顿等情感表达。当AI主播讲到搞笑段子时,会自然发出“哈哈哈”的笑声;聊到沉重话题时,又会刻意放慢语速,加入叹息声。这种“有血有肉”的语音表现,让听众完全忘记对面是个AI。
零样本克隆:名人声音1秒复刻,个性化播客开箱即用
SoulX-Podcast的另一大杀器是“零样本克隆”技术。传统语音克隆需要大量数据训练,但SoulX-Podcast直接“开挂”:无需额外训练,只需一段音频样本,就能1秒复刻特定声音和语气。
这意味着什么?创作者可以快速复刻名人访谈风格,让AI用明星的语气主持节目;或者为虚拟主播定制独特语调,打造专属IP。更关键的是,这项技术大幅降低了开发门槛——小型团队甚至个人创作者,也能轻松做出媲美专业团队的播客内容。
小插曲:有用户尝试用SoulX-Podcast克隆“新闻联播”主播的声音播报娱乐八卦,效果意外地和谐,评论区笑称:“AI这是要抢主持人的饭碗?”
AI播客时代加速到来,传统录音棚压力山大
SoulX-Podcast的上线,无疑将推动AI语音在媒体、娱乐、教育等领域的广泛应用。专家指出,传统录音棚模式依赖专业设备、场地和团队,成本高、周期长;而SoulX-Podcast让小型团队甚至个人创作者,都能高效产出高质量播客内容。
未来,随着模型升级至实时交互和跨平台集成,AI播客的应用场景将进一步扩展。比如,实时生成多语言播客满足全球听众需求,或与社交平台、智能音箱深度整合,让用户“说一句”就能定制专属音频内容。
(小贴士:SoulX-Podcast已在Soul平台开放体验,快去试试用方言+英语做一期“混搭播客”,说不定能火出圈!)
项目地址:https://github.com/Soul-AILab/SoulX-Podcast
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









