近期,快手又搞出大动静啦!其视频生成器Kling正式上线2.6版本,一下子带来了语音控制和动作控制两大核心功能,这简直就是给AI视频生成领域扔下了一颗重磅炸弹,带来了突破性的进展。
以前AI生成的视频不是声音不搭,就是动作僵硬,现在有了Kling2.6,这些问题都能迎刃而解,难道这不是我们期待已久的AI视频变革吗?和之前那些只能简单生成视频的工具相比,Kling2.6简直强太多了。
体验地址1:可灵AI官网
体验地址2:Kling AI官网
语音控制:从音效到个性化声音定制大升级
Kling2.6的语音控制功能可不简单,它是在同步视频音频生成技术的基础上搭建起来的。和Google Veo3、Sora2类似,它能够生成和视频内容完美匹配的音效、人声还有音乐。不管是说话、对话、旁白,还是歌唱、说唱等各种人声类型,它都能轻松搞定。而且,环境噪音和复合场景音效的处理也不在话下。
更让人惊喜的是,用户现在可以上传自己的声音来训练模型,或者直接上传音频文件,应用到文本转视频创作中。这一功能可太厉害了,它大大提高了角色的一致性。以前生成视频里的角色说话声音千篇一律,现在有了这个功能,角色能使用明确、可识别的声音说话,跨多个视频片段创建一致角色也变得轻而易举。
Kling AI展示的应用场景那叫一个丰富,产品演示、生活方式视频博客、新闻广播、体育评论、纪录片、访谈节目、戏剧短片和音乐表演,甚至连复调合唱等复杂形式都能涵盖。想象一下,以后看新闻,主播的声音就像真人一样亲切自然;看音乐表演,歌手的声音仿佛就在耳边响起,这体验简直绝了。

动作控制升级:精准捕捉复杂全身动作
Kling2.6的第二项重大更新,聚焦在动作控制系统的全面升级上。据Kling AI介绍,现在系统能够更精细地捕捉全身动作,就算是武术或舞蹈这种快速复杂的动作,也能准确处理。
以前,AI视频在处理手部动作和面部表情、唇形同步方面总是差强人意。手部动作常常模糊不清,面部表情和唇形同步也不自然。但现在不一样了,Kling2.6在这两个传统AI视频难点上有了很大改进。手部动作精准无模糊,面部表情和唇形同步也保持得非常自然。
用户可以上传3到30秒的动作参考片段,就能创建连贯的动作序列。而且,场景细节还能通过文本提示进行调整。社交媒体上已经出现了大量令人印象深刻的应用案例,AI生成视频内容正持续增长,创作者们正充分利用这一商机,创作出了许多富有创意的作品。说不定下一个爆款视频,就是出自使用了Kling2.6的创作者之手呢。

价格优势与市场布局:性价比高,多平台可用
Kling2.6除了在自有平台提供服务外,还能通过Fal.ai、Artlist和Media.io等第三方平台使用。它的API定价约为每秒生成视频0.07至0.14美元,价格会根据生成速度、时长和分辨率浮动,在市场上极具竞争力。KlingAI本身采用的是积分制计费,对于创作者来说,这样的计费方式更加灵活。
值得一提的是,12月初,快手还发布了Video O1,号称“全球首款统一多模态视频模型”。它可以通过文字指令编辑现有视频,实现更改主角、天气或视频风格等功能。这就像给视频加了一个神奇的魔法棒,想怎么改就怎么改。
竞争激烈,快手凭借独特优势脱颖而出
凭借这些创新功能,快手在竞争激烈的AI视频市场中与Google、OpenAI、Runway等西方公司,以及海罗、世达、维都等中国竞争对手展开了激烈角逐。不过,快手有着自己独特的优势。它运营着与TikTok规模相当的全球最大短视频平台之一快手(Kwai),能够获取海量的音视频和运动数据。这些数据就像是一座巨大的宝藏,为训练视频模型、实现声音同步和动作逼真提供了独一无二的优势。
相关对比
| 对比项目 | 其他AI视频工具 | 快手Kling2.6 |
|---|---|---|
| 语音控制 | 功能单一,角色声音一致性差 | 支持多种人声类型,可上传声音训练模型,角色声音一致性强 |
| 动作控制 | 手部动作模糊,面部表情和唇形同步不自然 | 精准捕捉全身动作,手部动作精准,面部表情和唇形同步自然 |
| 价格与平台 | 价格较高,平台选择有限 | 价格竞争力强,多平台可用 |
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:










