
2025年12月11日,AI视频生成领域的大明星Runway正式杀进“世界模型”这个热门赛道啦!该公司在著名社交媒体平台“X”的官方账号上发推文宣布正式上线了首个通用世界模型GWM - 1,还宣称能通过逐帧像素预测,打造一个懂物理规律、会时间演化的动态仿真环境。
这一下,Runway可就和谷歌、OpenAI这些巨头站在同一擂台,一起争夺下一代具身智能与通用人工智能的核心基础设施啦。难道这不会给行业带来一场巨大的变革吗?要知道,以前那些巨头在这领域可是一直占据着主导地位,现在Runway的加入,无疑会让竞争变得更加激烈。
模型地址:Runway网页版官网入口 (海外网站需要科学上网)
啥是世界模型?Runway的独特路径
所谓“世界模型”,简单来说,就是AI系统在内部模拟现实世界的运行机制。这样,就不用为每一种真实场景单独训练,AI就能实现推理、规划和自主行动啦。那怎么才能构建这样的模型呢?
Runway觉得,最优路径就是让模型直接学会预测像素。也就是从视频帧里学习物理、光照、几何和因果关系。公司CTO Anastasis Germanidis在直播里就强调:“要构建世界模型,得先打造一个超强大的视频模型。有了足够规模和高质量的数据支撑,模型自然就能深入理解世界是怎么运作的。”
GWM-1:三个分支各显神通
GWM-1可不是一个单一的产品,而是先以三个专业化分支落地。
GWM-Worlds:交互式动态世界
GWM - Worlds是个交互式应用。用户可以用文字提示或者图像设定初始场景,模型马上就能生成一个以24帧/秒、720p分辨率运行的动态世界。这个空间不仅有连贯的几何结构和光照逻辑,还能在用户“探索”的时候实时生成新内容。
这能力可不止适用于游戏开发哦,还能作为训练AI智能体在物理世界导航和决策的虚拟沙盒呢。想象一下,以后游戏里的场景能这么智能地变化,是不是超酷?
GWM-Robotics:机器人训练好帮手
在机器人领域,GWM - Robotics也发挥着重要作用。它通过合成数据注入天气变化、动态障碍物等变量,帮助机器人在高风险或者难以复现的真实场景里预演行为。
更重要的是,这个系统能识别机器人在什么条件下可能违反安全策略或指令,给可靠性验证提供了新工具。Runway已经打算通过SDK向合作企业开放这个模块,还透露正在和多家机器人公司深入交流呢。说不定以后机器人的智能程度会因为它而大大提升。
GWM-Avatars:真实人类行为逻辑的数字人
GWM - Avatars致力于生成具备真实人类行为逻辑的数字人,用于沟通、培训等场景。这个方向和D - ID、Synthesia、Soul Machines,甚至谷歌的数字人项目都有呼应。虽然目前三大分支是独立模型,但Runway明确表示,最终目标是把它们融合成一个统一的通用世界模型。
值得一提的是,在AI发展的浪潮中,不同公司都在探索各种模型的应用,像有些公司专注于图像识别,有些则在自然语言处理上发力,而Runway这次在世界模型上的探索,无疑是一次大胆且创新的尝试。
Gen4.5视频生成模型重大升级
除了GWM - 1,Runway还对本月早些时候上线的Gen4.5视频生成模型进行了重大升级。新版支持原生音频生成、一分钟时长的多镜头视频合成,还能保持角色一致性、添加对白与环境音效。
用户还能对已有视频的音频进行编辑,或者对任意长度的多镜头作品进行精细化调整。这一系列能力让Runway的视频工具越来越接近竞争对手Kling近期推出的“一体化视频套件”,也标志着AI视频生成正从创意原型迈向可投入生产的工业级工具。目前,升级后的Gen4.5已经向所有付费用户开放啦。
随着世界模型从理论走向工程落地,Runway正用“像素即物理”的哲学,搭建一座连接虚拟仿真与现实行动的桥梁。在这里,AI可不只是会看、会说,更开始理解世界是怎么运转的啦。
相信在未来,Runway还会给我们带来更多惊喜。
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码:









