智谱AI正式开源了他们的Sora「清影」-CogVideoX视频生成模型-AITOP100,AI资讯

智谱AI正式开源了他们的Sora「清影」-CogVideoX视频生成模型

2024年8月6日凌晨，智谱清影团队在视频创作界掀起了一场风暴——他们开源了名为CogVideoX的视频生成模型系列。这不仅仅是技术上的一个动作，这简直是在视频创作领域投下了一颗重磅炸弹！

CogVideoX是什么？

简单来说，CogVideoX是一个能够将你的文字直接转换成视频的神奇工具。这次的CogVideoX-2B模型，不仅视频生成能力惊人，而且对电脑配置的要求并不高，让普通用户也能轻松上手。

想要一探究竟？

那就上GitHub看看吧，地址就在这里：https://github.com/THUDM/CogVideo

不过，得提醒一句，这个模型是用英语来生成视频的，所以如果你想玩转它，先得把英语学好。

智谱清影AI下载暨CogVideoX模型下载地址：

https://huggingface.co/THUDM/CogVideoX-2b

CogVideoX模型下载地址

CogVideoX-2B的亮点可不少。生成视频时，你需要准备18GB的GPU内存（如果使用SAT技术），而使用diffusers的话，则需要36GB，但据说这个要求很快就会得到优化。如果你想要自己动手调教这个模型，那么40GB的GPU内存是必不可少的。

生成的视频长度为6秒，分辨率为720 * 480，帧率为8帧/秒。目前，它还不支持量化推理和多卡推理，但这并不影响它在视频生成技术上的重大意义。

CogVideoX模型亮点和配置要求

CogVideoX-2B的开源，无疑是在视频生成技术上的一大步。它让普通人也能轻松制作出高质量的视频内容，而且开源这件事，让全球的开发者和研究者都能参与到这个技术的共享和进步中来。

智谱清影团队还非常贴心地提供了详细的项目结构和使用指南，无论是命令行界面还是Web演示，都手把手教你如何使用这个模型。他们还公布了一个开源计划，包括：

模型的推理示例

在线体验演示

API接口示例

模型的微调示例

更让人期待的是，他们还计划发布CogVideoX-Pro，这是专为CogVideoX-2B设计的升级版。

智谱清影的开源举措，不仅刷新了视频生成技术的边界，也为技术爱好者开辟了新的学习天地。当前，视频生成领域充满活力，似乎昭示着国内AI视频技术即将迈入全新时代。

智谱清影的这一策略，无疑将其置于视频生成领域的先锋地位，未来的前景令人翘首以待。此次行动不仅是技术上的决断，更是对开源共享信念的践行，它传递出一个信息：技术的未来属于每一个愿意开源和分享的企业与个人。期待不久的将来，我们都能借助CogVideoX，创造出属于我们自己的视频生成奇迹。