稀宇科技(MiniMax)传来喜讯,其Speech - 02语音模型在Artificial Analysis榜单上持续稳坐全球领先之位。与此同时,稀宇科技正式推出Voice Design音色设计功能,这一功能的问世,为语音合成领域带来了全新的变革。
Voice Design赋予了用户极大的创作自由,用户仅需凭借自然语言描述,就能生成个性化的音色,真正实现了“任意语言 × 任意口音 × 任意音色”的全自定义组合。这一特性极大地降低了语音合成领域的技术门槛,让更多人能够轻松参与到语音创作中来。
稀宇科技介绍称,Voice Design功能具备精准控制音色多个维度的能力,涵盖音频质量、发声方式、情感基调以及人物画像等方面。用户只需输入相应的文本描述,模型便会自动对需求进行拆解,并生成与之匹配的音色编码。比如,用户可以描述“一位充满积极鼓励的AI助手,语调上扬且富有活力,韵律变化丰富多样”,或者“一位严厉的AI助手,采用女声,语速较快,音色明亮清晰”,系统便会依据这些描述生成符合要求的语音。
为了直观展示Voice Design的功能效果,稀宇科技还展示了一系列音色示例。其中有古代侠客那洪亮且正直的声音,仿佛让人置身于武侠世界;悬疑故事播音员低沉而磁性的嗓音,瞬间营造出紧张神秘的氛围;权威新闻女主播清晰利落的表达,尽显专业与干练;还有充满活力的推销员那快速的语速,让人感受到满满的热情。这些示例充分体现了Voice Design在音色定制方面的灵活性,能够满足不同场景下的语音需求。
稀宇科技指出,Voice Design的推出有效解决了语音合成领域面临的两大难题。一方面,传统音色库往往难以满足细分场景的多样化需求;另一方面,复刻音色不仅存在版权风险,而且操作过程复杂繁琐。而借助Voice Design,用户无需准备高质量的输入素材,就能快速生成理想的音色,并且可以将生成的音色存储起来,用于后续的音频创作。
截至目前,稀宇科技的两代Speech模型累计生成的语音时长已超过1.5亿小时,与全球超过30个国家的客户达成了合作。此次Voice Design功能的上线,再次彰显了稀宇科技在语音技术领域的持续创新能力,也体现了其致力于为全球用户提供更便捷、高效语音解决方案的决心。
用户可通过稀宇科技国内版平台(minimaxi.com/audio)或海外版平台(minimax.io/audio)体验Voice Design功能,开启属于自己的语音合成探索之旅。