Google DeepMind正式推出Gemini Robotics On-Device新一代AI机器人大模型-AITOP100,AI资讯

突破云端束缚，机器人AI本地化运行

最近，Google DeepMind可是在机器人AI领域投下了一颗“重磅炸弹”，正式发布了新一代机器人AI模型——Gemini Robotics On-Device。这一模型的诞生，标志着机器人AI技术迈向了更高效、更独立的新里程碑，给工业、仓储以及家庭服务机器人领域带来了革命性的变化。

Gemini Robotics On-Device

Gemini Robotics On-Device是基于Google Gemini2.0打造的视觉-语言-动作（VLA）模型，它最大的亮点就是完全能在机器人本地硬件上运行，无需依赖云端计算资源。以前，传统的云端机器人系统在网络不稳定的时候，就会出现延迟和可靠性差的问题，而这款模型完美地解决了这一难题。

Gemini Robotics On-Device

DeepMind高级总监Carolina Parada说：“这模型小巧又高效，能直接在机器人硬件上跑，保证了低延迟和离线环境下的稳定表现。”有了它，机器人在网络受限的场景，像工厂、仓库或者偏远地区，实用性大大提升。

测试结果显示，它的性能接近云端Gemini Robotics模型，而且在多项基准测试中还超越了其他本地 AI 模型，竞争力十足。

通用又灵活，少量演示就能适应新任务

Gemini Robotics On-Device不仅性能出色，任务适应能力也让人眼前一亮。DeepMind宣称，这个模型只需要50到100 次演示，就能快速适应新任务，比如解拉链、叠衣服或者进行工业装配。

一开始，这个模型是针对 ALOHA 机器人进行训练的，但它已经成功适配了双臂Franka FR3机器人和Apptronik的Apollo人形机器人，这充分展现了它跨硬件平台的通用性。开发者还能通过自然语言指令来控制和微调模型，让它轻松应对复杂的双臂任务或者在动态环境中的新对象。Parada强调：“生成式AI让机器人能从少量数据中泛化，大大加速了在复杂场景中的部署。”

开放开发者生态，SDK助力创新

为了让Gemini Robotics On-Device能在行业里更快地应用起来，Google DeepMind还同步发布了一款软件开发工具包（SDK），现在已经通过GitHub向“受信任测试者”计划开放申请了。

开发者可以利用这个SDK在 Google 的 MuJoCo 物理模拟器或者现实环境中测试和微调模型。这可是DeepMind第一次向开发者开放VLA模型的微调权限，给机器人 AI 的定制化应用铺平了道路。

有了这个SDK，开发者通过少量演示就能快速训练机器人完成特定任务，比如把魔方放进袋子或者处理精细的工业操作。DeepMind表示，这个模型在没见过的新场景和对象上表现也很棒，比如在工业传送带上完成装配任务，泛化能力超强。

安全与前景：机器人AI的未来之路

在安全方面，DeepMind可没含糊，强调Gemini Robotics On-Device通过了一系列全面的安全措施，还和专家、政策制定者合作，努力降低潜在风险。同时，这款模型的发布也让Google在通用机器人AI领域和Nvidia GR00T、OpenAI RT-2等竞争对手的竞争更加激烈了。

从仓库机器人到家用服务机器人，Gemini Robotics On-Device的本地化运行能力和快速学习特性，为它在多个场景中的广泛应用打下了坚实的基础。

可以预见，这一技术不仅能降低机器人部署成本，还可能让AI驱动的自动化走进更多日常生活场景，为我们的生活带来更多便利。

模型地址：https://deepmind.google/discover/blog/gemini-robotics-on-device-brings-ai-to-local-robotic-devices/

想了解AITOP100平台其它版块的内容，请点击下方超链接查看

AI 创作大赛 | AI活动 | AI工具集 | AI资讯专区

AITOP100平台官方交流社群二维码：

AITOP100平台大赛社群二维码