家人们,腾讯AI团队又搞出大动静啦!他们推出了一款超牛的AI唱歌模型LeVo,这消息一出来,就在音乐圈和科技圈炸开了锅。LeVo凭借强大的音色克隆、分轨生成以及高保真音乐表现,让业界纷纷热议,在多项关键指标上都能和行业领先的Suno 4.5掰掰手腕,为中国AI音乐生成技术狠狠争了一口气。下面小编就给大家好好扒一扒LeVo的突破性功能和潜力。
腾讯LeVo AI唱歌模型是什么?
LeVo是腾讯AI实验室的得意之作,它采用了语言模型(LM)架构,把LeLM和音乐编解码器结合在一起,就像给模型装上了“超级大脑”。它能并行生成混合音轨(把人和伴奏融合在一起)或者双轨音轨(人声和伴奏分开)。
在音乐性、音质、人声与伴奏和谐度以及歌词对齐这些维度上,LeVo全面碾压现有的开源学术模型。最新的评测结果显示,LeVo在歌词对齐能力(LYC)上比Suno 4.5还高出0.21分呢,这文本控制能力简直绝了!
零样本音色克隆:开启个性化音乐创作新大门
LeVo有一个超厉害的功能,就是零样本音色克隆(Zero-Shot Voice Cloning)。只要3秒的音频片段,它就能精准复制目标音色,不管是音调、情感还是韵律,都能完美还原。而且啊,这个功能不需要大量的训练数据,大大降低了音乐创作的技术门槛。
不管你是想给自己定制专属音色,还是想模仿知名歌手的风格,LeVo都能轻松搞定,生成的效果自然又流畅,给创作者带来了无限可能。想象一下,你也能拥有像明星一样的歌声,是不是超酷?
分轨生成:专业音乐制作人的得力助手
和传统的AI音乐生成模型不一样,腾讯 LeVo支持双轨生成模式,能分别生成人声和伴奏音轨。这对于专业音乐制作人来说,简直就是福音啊!它为后期的混音和编辑提供了更大的灵活性,能轻松实现高质量的分轨输出,优化创作流程。
相比之下,Suno4.5在音色克隆和分轨支持上就有点逊色了。LeVo的这一特性,无疑为行业树立了新的标杆,让音乐制作变得更加高效和专业。
高保真与多场景应用:音乐创作的全能选手
LeVo在音质表现上已经接近Suno 4.5的行业标准了,特别是在音乐性、人声与伴奏和谐度和音质(MOS评分)等方面表现得相当出色。虽然在歌曲结构清晰度上比Suno 4.5和Mureka - O1稍微差那么一点点,但LeVo通过多偏好对齐方法优化了生成结果,确保音乐在各种风格和场景下都能保持高保真效果。
不管是流行音乐、影视配乐还是广告制作,LeVo都能提供专业级的输出。有了它,音乐创作变得更加简单和高效,不管你是专业人士还是业余爱好者,都能轻松创作出高质量的音乐作品。
开源承诺:助力AI音乐生态蓬勃发展
腾讯表示,LeVo将以开源的形式发布,计划提供完整的代码和预训练模型,供全球开发者免费使用。这一举措太赞了,不仅体现了腾讯在AI音乐领域的雄心壮志,也为全球音乐创作社区注入了新的活力。
LeVo的开源策略能有效降低创作门槛,让更多的内容创作者和音乐爱好者能够实现自己的创意表达。以后,说不定会有更多优秀的音乐作品因为LeVo而诞生呢!
腾讯LeVo的发布,标志着中国AI音乐生成技术迈向了全球前沿。它的零样本音色克隆和分轨生成功能,为音乐创作带来了革命性的突破。虽然在部分指标上和Suno 4.5还有一点差距,但LeVo凭借高性价比和开源优势,已经成为AI音乐领域的强有力竞争者。小编觉得,LeVo的推出不仅提升了中国AI技术的国际影响力,也为音乐创作的民主化进程迈出了重要的一步。未来,让我们一起期待LeVo带来更多的惊喜吧!
地址:腾讯LeVo官网入口