Vidu 视频模型开放 Sora架构
7月30日,生数科技正式宣布其Vidu视频模型对外开放,并开放了API申请。这一举措标志着我国在AI视频生成领域的又一次重大突破。Vidu模型凭借其独特的U-ViT架构,可模拟真实物理世界,为用户提供高质量的AI视频生成服务。
早在今年4月28日,Vidu模型便在中关村论坛未来人工智能先锋论坛上与清华大学共同发布,成为国内首个长时长、高一致性、高动态性的视频大模型,达到Sora级别。如今,Vidu模型开放Sora架构,将为更多用户带来创新体验。
Vidu官网地址
地址:点击此处进入Vidu官网
API内测地址:点击此处进行Vidu的API内测申请
Vidu视频宣传片如下:
Vidu模型的核心技术U-ViT架构由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构。2023年3月,团队开源了全球首个基于U-ViT融合架构的多模态扩散模型UniDiffuser,率先完成了U-ViT架构的大规模可扩展性验证。
Vidu套餐服务详情
免费版:无积分,不支持商用
包月套餐:US$7.99/月,年费US$95.99(50%折扣),支持生成4秒视频,超清,不支持商用
标准版:US$23.99/月,年费US$287.99,支持生成4秒视频,超清,不支持商用
高级版:US$79.99/月,年费US$959.99(50%折扣),支持生成4秒至8秒视频,超清,支持商用,1个并行任务,超清后去除水印
尊享版:年费US$287.99,支持生成4秒至8秒视频,超清,支持商用,4个并行任务,新功能优先体验,超清后去除水印
主要特点和技术创新:
1. 模型结构:Vidu模型融合了Diffusion与Transformer技术,创新性地开发了U-ViT架构。
2. 视频生成能力:Vidu能够一键生成长达16秒、分辨率高达1080P的高清视频内容。
3. 实际应用演示:官方资料中展示了一个视频示例,内容是“画室中的一艘船驶向镜头”,展现了船和海浪的逼真效果。
4. 高级功能:Vidu不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。
Vidu的开放,将为我国AI视频生成领域带来新的发展机遇。用户可通过API申请,利用Vidu模型进行各种创新应用的开发。未来,随着Vidu技术的不断成熟和普及,必将为人们的生活和工作带来更多便利。