6月6日,生数科技与清华大学联合发布的Vidu视频大模型完成了重大技术更新,引发了业界的广泛关注。Vidu视频国产大模型是一款基于人工智能技术的视频生成工具,它能够在短时间内生成高质量的视频内容。此次更新包括视频时长延长至32秒、音视频合成技术的引入以及4D生成能力的实现,为用户带来了更加丰富和真实的视频体验。
时隔40天,全面对标Sora的我们中国首个自研视频大模型Vidu在此取得重大进展并且低调曝光。
首先,Vidu视频大模型将视频时长延长至32秒,相比之前的16秒,用户可以生成更加完整和连贯的视频内容。这一改进不仅增加了用户创作的自由度,还使得生成的视频更具吸引力,能够更好地满足用户的需求。
其次,Vidu视频大模型首次支持音视频合成技术,即Text-2-Audio功能。这一技术的引入使得生成的视频不再只是视觉上的呈现,还能够通过音频的加入,为用户提供更加真实和丰富的听觉体验。用户可以根据自己的需求为视频添加背景音乐、声音效果等,进一步提升视频的观赏性和吸引力。
最后,Vidu视频大模型还实现了4D生成能力,能够从单一的视频中生成时空一致的4D内容。这一技术进一步增强了视频生成的多样性和真实感,为用户带来了更加丰富和沉浸式的观看体验。
我终结下最新技术更新亮点:
1.32秒视频生成功能:用户现在可以轻松生成长达32秒的视频,大幅提升了创作时长和内容丰富度。
2. 音视频合成技术:Vidu新增了音视频合成功能,使得生成的视频不仅视觉效果出众,还具备完整的音频体验,实现了“视频有声音了”(Text-2-Audio)的技术突破。
3. 4D内容生成能力:Vidu能够从单一视频源中生成时空连贯的4D内容,进一步增强了视频的沉浸感和动态表现力。
而且,Vidu模型通过融合Diffusion和Transformer技术,创新性地推出了U-ViT架构。在四月份的发布中,Vidu展示了其强大的视频生成能力,能够一键创作出长达16秒、清晰度达到1080P的高清视频内容。据官方介绍,Vidu不仅能够精确模拟现实世界的物理现象,还具备无限的创意想象力,同时实现了多角度镜头的生成和高度一致的时空连续性。
Vidu视频大模型的最新技术更新在视频生成领域取得了显著进展,不仅提高了视频生成的多样性和真实感,还标志着Vidu在国际视频生成技术领域的领先地位。未来,我们期待Vidu能够继续推出更多创新功能,为用户带来更加丰富和便捷的视频创作体验。
Vidu视频大模型体验地址:
地址: https://www.aitop100.cn/tools/detail/1894.html
目前Vidu视频大模型已在PixWeaver网站开放内测申请,大家可以去申请内测体验下,期待我们的国产AI视频大模型能够早日发展壮大起来!