腾讯AI黑科技 GeometryCrafter：让你的视频秒变3D大片！-AITOP100,AI资讯

哈喽大家好！最近科技圈又炸了，腾讯放大招，推出了一款名叫GeometryCrafter的AI模型，厉害到什么程度呢？简单来说，就是能把咱们平时拍的普通视频，瞬间变成3D大片，而且操作简单到哭！

GeometryCrafter是啥？为啥这么牛？

这款模型的核心，就是能从那些咱们平时拍的各种各样的视频里，提取出里面的几何信息。啥叫“各种各样的视频”？就是那种内容多、场景换来换去、视角也经常变的，比如你在街上随便拍的，或者出去旅游拍的风景，甚至是纪录片啥的。你想啊，这种视频对AI的要求可高了，得保证视频里东西的空间位置是对的，不能一会儿歪一会儿斜的，还得啥视频都能处理。腾讯的团队厉害就厉害在这儿，他们把预训练的扩散模型用到了视频几何估计上，结果就是，GeometryCrafter能直接生成超级细腻、连贯的深度信息和几何结构，而且还不用你提供相机位置或者光流数据这些乱七八糟的东西！

GeometryCrafter

灵感来源：图像生成领域的“去噪”大法

据说，这玩意的灵感来自图像生成，就是那种AI画图的技术。扩散先验技术就像一个“去噪”的过程，能把视频里每一帧之间的细微联系抓出来，然后变成3D空间的几何信息。不管是熙熙攘攘的街道，还是光影变幻的山河，GeometryCrafter都能给你还原得跟真的一样！这下好了，视频内容直接从2D变3D，以后做特效、做VR内容，那还不是分分钟的事儿？

填补空白：开放世界视频的福音

有专家说了，GeometryCrafter的出现，简直就是填补了开放世界视频几何估计领域的一大空白。之前那些模型，处理稍微长一点的视频，或者场景复杂一点的，就容易出错，因为它们理解不了视频里的上下文信息。GeometryCrafter厉害的地方在于，它用了三阶段训练策略，真实数据和合成数据一起用，既保证了视频内容的多样性，又保证了几何细节的准确性。实验结果也证明了，这模型在很多公开数据集上的表现都超过了其他方法，尤其是在保持长时间视频的连贯性上，简直就是行业标杆！

GeometryCrafter

普通人也能玩转3D？

对于咱们普通用户和创作者来说，GeometryCrafter的意义就更大了。想象一下，你用手机拍的孩子奔跑的视频，通过这个技术，就能变成3D的，甚至可以放到虚拟场景里！或者，你是个独立电影人，用GeometryCrafter就能把简单的素材变成沉浸式的视觉体验。更赞的是，腾讯这次直接把模型代码和权重开源了，让更多人都能参与进来，一起探索这个技术的可能性。

GeometryCrafter的局限性

当然，GeometryCrafter也不是完美的。有人说，这玩意儿对电脑配置要求有点高，普通电脑可能跑不动，而且在特别复杂的场景里，比如人特别多或者物体运动速度特别快的时候，效果可能还有提升空间。但不管怎么说，这项技术的出现，都给我们打开了一扇新的大门，让我们看到了AI是如何把咱们的生活片段变成充满立体感的数字艺术的。

腾讯再次证明实力

GeometryCrafter的发布，再次证明了腾讯在AI领域的实力。从视频内容的几何重构，到各种跨领域的应用，这款模型不仅仅是一项技术突破，更像是一个邀请，邀请我们用科技的力量，去重新发现和塑造这个世界！

详情查看：GeometryCrafter官网地址

想了解更多AI创作软件工具请关注AI 人工智能网站--AITOP100平台--AI工具集