• 首页
  • AI工具集
  • AI资讯
  • AI活动
  • AI社区
  • AI短剧
  • AI创作大赛
  • AI小说
  • AI绘画
    AI视频
    AI音乐
    AI对口型
    AI创意二维码
    AI艺术字
    AI智能抠图
  • AI漫剧创作热门-AI社区
AI 对话

LeCun 亲自上阵!Meta的 V-JEPA 2 到底啥来头?

LeCun 亲自上阵!Meta的 V-JEPA 2 到底啥来头?
AI TOP100

AI 老将 LeCun 的新动作!

最近,AI 圈的元老级人物 LeCun 可是亲自上阵了!Meta 刚发布了个博客,他就迫不及待地拍了个视频,介绍他们的最新成果:V-JEPA 2。看来这次他是真的认真了!

你可能要问了,这 V-JEPA 2 到底是个啥?简单来说,LeCun 觉得未来的 AI 应该更懂世界,能像人一样理解物理规律,甚至能像人一样预测未来会发生什么。所以,V-JEPA 2 的目标就是打造一个能改变 AI 与现实世界交互方式的“世界模型”。 最近 Meta 可没少搞大动作,又是组建“超级智能”团队,又是高薪挖人,一副要All in AGI(通用人工智能)的架势。

这难免让人猜测,LeCun 是不是要在 Meta 坐冷板凳了?毕竟,其他科技巨头都在追逐更热门的方向,而 LeCun 却像个“孤勇者”,坚持自己的“世界模型”之路。

V-JEPA 2:世界模型的最新进展

Meta 这次发布的 V-JEPA 2,可是第一个基于视频训练的世界模型。它不仅能理解和预测视频内容,还能实现“零样本规划”和“机器人在新环境中的自主控制”。

简单来说,V-JEPA 2 就是想让 AI 像人一样,通过观察视频来学习世界的运作方式,然后利用这些知识来预测未来,并规划自己的行动。 V-JEPA 2 拥有 12 亿参数,基于 Meta 之前提出的 JEPA 架构。这次的 V-JEPA 2 在动作预测和世界建模方面有了更大的提升,让机器人能够在陌生的环境中与物体互动并完成任务。Meta 还发布了三个全新的评估集,用来测试模型在视频中的理解和推理能力。

网友怎么看?

对于 V-JEPA 2 的发布,LeCun 的支持者们自然是赞不绝口。

当然,也有一些犀利的评论,质疑 V-JEPA 2 是否真的具有突破性技术,以及 Meta 的 AI 政策是否出了问题。

世界模型:AI 的未来?

LeCun 认为,世界模型是 AI 实现高级智能的关键。他用一个例子解释了世界模型的概念:把网球抛向空中,它会因为重力而落回地面。如果它突然转向或者变成苹果,那才奇怪。

这种对物理世界的直觉,就是世界模型的体现。它让我们可以预测事物的未来,并根据预测来规划自己的行动。 V-JEPA 2 就是 Meta 在世界模型方向上的一个重要尝试。它通过视频数据,学习物理世界的运作规律,并让机器人能够像人一样理解和适应新环境。

V-JEPA 2 的训练过程

V-JEPA 2 的训练分为两个阶段: * **第一阶段:无动作预训练。** 通过大量的视频和图像数据,让模型学习关于世界运作方式的知识,比如物体如何交互、如何移动等等。 * **第二阶段:动作条件训练。** 加入机器人数据,让模型学会根据具体的行动来进行预测和规划。

通过这两个阶段的训练,V-JEPA 2 就能实现精准规划,让机器人能够“即插即用”,完成各种任务。

机器人也能“即插即用”?

V-JEPA 2 最激动人心的应用之一就是零样本机器人规划。传统的机器人模型需要针对特定机器人和环境进行训练,而 V-JEPA 2 则可以直接部署到实验室的机器人上,完成抓取、拾取物体、放置到新位置等任务。

Meta 还发布了三个全新的基准测试,用于评估现有模型从视频中理解和推理物理世界的能力。

通往高级机器智能?

Meta 接下来还将深入探索世界模型,比如开发分层的 JEPA 模型,使其能够在不同的时间和空间尺度上进行学习、推理和规划。他们还将开发多模态 JEPA 模型,使其不仅能通过视觉进行预测,还能融合听觉、触觉等多种感知能力,实现更全面的世界理解。 LeCun 的“世界模型”之路,究竟是引领 AI 的下一个潮流,还是走上了歧路?让我们拭目以待!
0
0
文章来源:AI TOP100
原文链接:https://36kr.com/p/3334353865861635
免责声明:本文不代表本平台立场,且不构成投资建议,请谨慎对待。
全部评论
暂无评论
相关资讯
  • 夸克重磅推出千问助手,阿里千问App公测上线,AI生活加速到来!

  • AI Agent聚合平台MuleRun 2.0:上线30天用户破50万,美国成“主力军”

  • 谷歌Gemini Pro/Ultra用户迎来Veo 3.1视频模型正式上线,三图融合玩转视频创作!

  • 谷歌NotebookLM正式上线图像识别功能,图像导入,让知识检索变得超简单!

  • AI霸主地位岌岌可危?Databricks创始人警告:美国或拱手相让中国!

热点资讯

告别PPT熬夜!开源神器Presentation-AI免费来袭,本地运行碾压Gamma.app

7天前
告别PPT熬夜!开源神器Presentation-AI免费来袭,本地运行碾压Gamma.app

火山引擎发布豆包编程模型,首月9.9元,支持长上下文与视觉理解

5天前
火山引擎发布豆包编程模型,首月9.9元,支持长上下文与视觉理解

Google DeepMind上线SIMA 2预览版,性能飞跃迈向通用机器人

2天前
Google DeepMind上线SIMA 2预览版,性能飞跃迈向通用机器人

百度发布文心5.0:超稀疏架构与全模态能力引领AI应用新方向

3天前
百度发布文心5.0:超稀疏架构与全模态能力引领AI应用新方向

国产AI再突破!月之暗面Kimi K2Thinking开源,460万美元成本力压GPT-5?

7天前
国产AI再突破!月之暗面Kimi K2Thinking开源,460万美元成本力压GPT-5?
分享
0
0

欢迎来到AI Top100!我们聚合全球500+款AI智能软件,提供最新资讯、热门课程和活动。我们致力于打造最专业的信息平台,让您轻松了解全球AI领域动态,并为您提供优质服务。

合作伙伴
联系我们
加入AITOP100社群
加入社群
AITOP100商务微信
商务微信
相关链接
服务及隐私政策
网站地图
关于我们
粤ICP备2022124843号-2粤公网安备44030002004505广播电视节目制作经营许可证:(粤)字第00712号Copyright © 华强方特(深圳)动漫有限公司 版权所有