2024年8月6日凌晨,智谱清影团队在视频创作界掀起了一场风暴——他们开源了名为CogVideoX的视频生成模型系列。这不仅仅是技术上的一个动作,这简直是在视频创作领域投下了一颗重磅炸弹!
CogVideoX是什么?
简单来说,CogVideoX是一个能够将你的文字直接转换成视频的神奇工具。这次的CogVideoX-2B模型,不仅视频生成能力惊人,而且对电脑配置的要求并不高,让普通用户也能轻松上手。
如何获取和使用CogVideoX?
想要一探究竟?
那就上GitHub看看吧,地址就在这里:https://github.com/THUDM/CogVideo
不过,得提醒一句,这个模型是用英语来生成视频的,所以如果你想玩转它,先得把英语学好。
智谱清影AI下载暨CogVideoX模型下载地址:
https://huggingface.co/THUDM/CogVideoX-2b
模型亮点和配置要求
CogVideoX-2B的亮点可不少。生成视频时,你需要准备18GB的GPU内存(如果使用SAT技术),而使用diffusers的话,则需要36GB,但据说这个要求很快就会得到优化。如果你想要自己动手调教这个模型,那么40GB的GPU内存是必不可少的。
生成的视频长度为6秒,分辨率为720 * 480,帧率为8帧/秒。目前,它还不支持量化推理和多卡推理,但这并不影响它在视频生成技术上的重大意义。
CogVideoX-2B的开源意义
CogVideoX-2B的开源,无疑是在视频生成技术上的一大步。它让普通人也能轻松制作出高质量的视频内容,而且开源这件事,让全球的开发者和研究者都能参与到这个技术的共享和进步中来。
项目结构和开源计划
智谱清影团队还非常贴心地提供了详细的项目结构和使用指南,无论是命令行界面还是Web演示,都手把手教你如何使用这个模型。他们还公布了一个开源计划,包括:
模型的推理示例
在线体验演示
API接口示例
模型的微调示例
更让人期待的是,他们还计划发布CogVideoX-Pro,这是专为CogVideoX-2B设计的升级版。
智谱清影引领视频生成技术新潮流
智谱清影的开源举措,不仅刷新了视频生成技术的边界,也为技术爱好者开辟了新的学习天地。当前,视频生成领域充满活力,似乎昭示着国内AI视频技术即将迈入全新时代。
智谱清影的这一策略,无疑将其置于视频生成领域的先锋地位,未来的前景令人翘首以待。此次行动不仅是技术上的决断,更是对开源共享信念的践行,它传递出一个信息:技术的未来属于每一个愿意开源和分享的企业与个人。期待不久的将来,我们都能借助CogVideoX,创造出属于我们自己的视频生成奇迹。
智谱清影AI下载使用地址:点击直接进入清影AI官网
AITOP100平台推荐--国内外AI视频热门工具汇总榜单