• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

Meta联手港中文搞大事!Multi-SpatialMLLM模型让AI空间感爆棚!

Meta联手港中文搞大事!Multi-SpatialMLLM模型让AI空间感爆棚!
AI TOP100
2025-05-29 15:58:58

Meta联手港中文搞大事!Multi-SpatialMLLM模型让AI空间感爆棚!

听说没?科技巨头Meta最近又放大招了!这次是联手香港中文大学,推出了一个超厉害的东东,名叫 Multi-SpatialMLLM模型。简单来说,这玩意儿让AI在空间理解方面直接开了挂!再也不用担心机器人分不清左右、搞不清方向了!

Multi-SpatialMLLM模型

为啥要搞这么个东西呢?你想啊,现在机器人、自动驾驶啥的,对空间理解能力要求越来越高。可现在的AI,说白了还是有点“路痴”,连左右都分不清,这可咋整?主要原因就是训练数据不够,而且以前的方法只能看到静态的画面,缺少动态的信息。

MultiSPA数据集:海量数据喂饱AI!

为了解决这个问题,Meta的FAIR团队和港中文联手搞了个MultiSPA数据集。这数据集里有超过2700万个样本,各种3D、4D场景应有尽有,还用了Aria Digital Twin和Panoptic Studio等高质量标注数据,甚至还请来了GPT-4o来帮忙生成各种任务模板,简直壕无人性!

三大组件加持,空间推理能力杠杠的!

这个Multi-SpatialMLLM模型可不是吃素的,它整合了深度感知、视觉对应和动态感知三大组件,直接突破了以前只能看静态图像的限制。研究团队还设计了五个训练任务,包括深度感知、相机移动感知、物体大小感知等等,专门提升它在多帧空间推理方面的能力。

测试结果:简直是开挂!

效果怎么样?那叫一个惊艳!在MultiSPA基准测试中,Multi-SpatialMLLM平均提升了36%,在一些定性任务中,准确率达到了80-90%,直接秒杀基础模型的50%。尤其是在预测相机移动向量这种高难度任务上,准确率也飙升到了18%!

BLINK测试:接近90%准确率!

更牛的是,在 BLINK 基准测试中,Multi-SpatialMLLM 的准确率接近90%,平均提升了26.4%,甚至超越了一些专有系统。而且,在标准的视觉问答(VQA)测试中,它也没掉链子,保持了原有的性能,说明它不只是擅长空间推理,通用能力也很强!

想了解更多AI创作软件工具请关注AI人工智能网站--AITOP100平台--AI工具集

0
0
文章来源:AI TOP100
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • Lone Palm Labs推出新应用Splat:利用AI将照片一键转化为儿童涂色页

  • Higgsfield AI推出Cinema Studio,提供电影级创作工具,支持ARRI/RED等设备模拟

  • Manus 8个月实现1亿美元ARR,成AI代理赛道增长最快企业

  • 十亿流量瞬间归零!YouTube永久封禁两大AI虚假预告片“元老”频道

  • 苹果多模态AI模型UniGen1.5正式上线,图像处理“三合一”超厉害

热点资讯

苹果多模态AI模型UniGen1.5正式上线,图像处理“三合一”超厉害

5天前
苹果多模态AI模型UniGen1.5正式上线,图像处理“三合一”超厉害

抖音漫剧流量密码与官方扶持全解析

8天前
抖音漫剧流量密码与官方扶持全解析

每日AI资讯-2025年12月17日

6天前
每日AI资讯-2025年12月17日

每日AI资讯-2025年12月15日

8天前
每日AI资讯-2025年12月15日

每日AI资讯-2025年12月22日

1天前
每日AI资讯-2025年12月22日
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有