• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    视频转动漫风格
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI短视频创作热门-AI社区
AI 对话

3DTown:一张照片就能建城?这AI黑科技也太牛了吧!

3DTown:一张照片就能建城?这AI黑科技也太牛了吧!
AI TOP100
2025-05-22 18:19:01

3DTown:听说你还在吭哧吭哧建模?OUT啦!

最近啊,科技圈炸锅了!普林斯顿大学、哥伦比亚大学,还有一家叫Cyberever AI的公司,他们搞了个叫3DTown的框架,说白了,就是专门帮你建3D城镇的!厉害在哪儿?你只要给它一张城镇的俯视图,它就能给你“duang”的一下,生成一个栩栩如生的3D城镇场景!而且!它还不用训练!省了你吭哧吭哧找数据、训练模型的时间,简直懒人福音!

3DTown

传统3D建模:费钱费力,简直就是个坑!

以前,搞3D场景,那是土豪玩家的游戏。为啥?

  • 设备贵到吐血: 几十万、上百万的3D扫描仪,普通人根本摸不着!
  • 数据多到崩溃: 得从各个角度拍拍拍,不然模型全是盲区。
  • 人工建模累成狗: 建模师熬夜加班,头发都掉光了!

AI虽然进步了不少,但要生成复杂的3D场景,还是经常翻车:

  • 结构歪七扭八: 建筑像喝醉了酒一样,东倒西歪。
  • 布局胡编乱造: 和原图完全不一样,AI的想象力太丰富了!
  • 模型粗糙不堪: 细节模糊,材质贴图惨不忍睹。

3DTown

3DTown:一张图,秒变城!

3DTown就是来拯救世界的!它的核心思想是,用最少的输入(一张俯视图),生成最棒的3D场景。比如,你随便找张雪镇的照片,或者自己画个荷兰小镇的草图,丢给3DTown,它就能给你变出真假难辨的3D模型!

它怎么做到的?秘诀就在两大“黑科技”:

区域生成:化整为零,各个击破!

直接让AI一口气生成整个3D场景?太难了!3DTown聪明的地方在于,它把俯视图分成 overlapping(重叠)的区域,然后单独生成每个区域的3D模型。就像把拼图分成小块,AI集中精力拼好每一块。好处多多:

  • 分辨率更高,细节更多: 每个区域都是独立的,AI能火力全开,生成高分辨率的模型。
  • 图像和3D更对齐: AI更了解局部细节,生成的模型更符合图片。

空间感知3D修复:让“碎片”完美合体!

分成小块生成虽然好,但怎么把这些“碎片”拼成一个完整的整体呢?这就是3DTown的第二个“黑科技”——空间感知3D修复!

它会先根据图片,估算出粗略的3D结构,给AI画个“草稿”。然后,用蒙版矫正流(masked rectified flow)去填充缺失的部分,保证整体结构的连贯性。就像专业的“3D瓦工”,把积木之间的缝隙填得天衣无缝!

不用训练,效果杠杠的!

更厉害的是,3DTown不用训练!它直接用预训练好的3D对象生成器(比如Trellis),然后用区域生成和空间修复,合成复杂的3D场景。就像顶级厨师,直接用市场上最好的食材,做出米其林大餐!

实验证明,3DTown实力超群,各项指标都超过了其他模型:

  • 几何质量: 无论是人类还是GPT-4o评分,3DTown生成的模型都更精细、更真实!
  • 布局连贯性: 生成的场景和原图完美对齐,不会“跑偏”。
  • 纹理保真度: 模型表面的纹理逼真、一致,就像真实世界一样。

雪镇、沙漠小镇、荷兰小镇,3DTown都能轻松驾驭,生成高度连贯的3D场景!其他模型要么结构太简单,要么布局扭曲,要么物体重复。

3DTown的成功秘诀:拆解与缝合!

这项技术再次证明,“空间分解”和“先验引导修复”对于将2D图像变成高质量3D场景有多重要。

区域分解让AI能在局部发挥优势,避免处理整个复杂场景时力不从心。地标引导就像“定海神针”,保证了场景的整体结构和关键物体的连续性,防止“跑偏”。

这项技术对游戏开发、电影制作、元宇宙、机器人仿真训练等领域都有巨大潜力。想象一下,未来我们只需要一张草图,就能快速生成一个可以探索的3D世界!

小小吐槽,未来可期!

当然,3DTown也有不足:

  • 它依赖的预训练3D生成器是基于单个物体训练的,所以可能会出现重复的立面或不真实的屋顶形状。
  • 它对初始3D结构的估计有时会有“漏洞”,导致表面空洞或过于平滑。

但这些都可以优化,比如结合多视角数据、引入语义先验、场景级别的微调等。

3DTown的出现,是3D内容生成领域的一个里程碑!它以一种巧妙、高效且无需训练的方式,为我们打开了从2D到3D快速构建复杂场景的大门。未来,我们每个人都能成为3D世界的“创世神”,一张图就能打造理想之城!

论文地址:https://arxiv.org/pdf/2505.15765

项目地址:https://eric-ai-lab.github.io/3dtown.github.io/

更多AI行业最新资讯新闻信息(ai界最新新闻)请关注AI人工智能网站--AITOP100平台--AI资讯

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 细思极恐!Meta竟然用色情片训练AI,背后隐藏的人性黑洞让人不寒而栗

  • 2025年自主AI智能体全景图:12款顶级产品深度评测与企业应用指南

  • Genie 3革命性突破:从2D游戏到3D世界,Google的AGI世界模型如何重塑未来?

  • Gamma AI:从"模板选择"到"内容驱动"的演示工具范式突破

  • AI行业震荡周:DeepSeek V3.1颠覆格局,人才缺口破500万大关 | 2025年8月第三周全景报告

热点资讯

即梦AI智能多帧功能上线:10张图生成54秒超长镜头,视频创作门槛大降!

1天前
即梦AI智能多帧功能上线:10张图生成54秒超长镜头,视频创作门槛大降!

DeepSeek V3.1正式发布:128K上下文窗口重新定义AI模型能力边界

4天前
DeepSeek V3.1正式发布:128K上下文窗口重新定义AI模型能力边界

可灵2.1首尾帧功能炸场!影视级转场+复杂运镜,一键解锁创作自由!

1天前
可灵2.1首尾帧功能炸场!影视级转场+复杂运镜,一键解锁创作自由!

AITOP100 AI应用重磅更新!Veo3、即梦AI 3.0、Vidu Q1、海螺AI、Luma全新升级

3天前
AITOP100 AI应用重磅更新!Veo3、即梦AI 3.0、Vidu Q1、海螺AI、Luma全新升级

DeepSeek V3.1全面技术解读:从架构到应用的系统性评估与对比分析

4天前
DeepSeek V3.1全面技术解读:从架构到应用的系统性评估与对比分析
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有