突破云端束缚,机器人AI本地化运行
最近,Google DeepMind可是在机器人AI领域投下了一颗“重磅炸弹”,正式发布了新一代机器人AI模型——Gemini Robotics On-Device。这一模型的诞生,标志着机器人AI技术迈向了更高效、更独立的新里程碑,给工业、仓储以及家庭服务机器人领域带来了革命性的变化。
Gemini Robotics On-Device是基于Google Gemini2.0打造的视觉-语言-动作(VLA)模型,它最大的亮点就是完全能在机器人本地硬件上运行,无需依赖云端计算资源。以前,传统的云端机器人系统在网络不稳定的时候,就会出现延迟和可靠性差的问题,而这款模型完美地解决了这一难题。
DeepMind高级总监Carolina Parada说:“这模型小巧又高效,能直接在机器人硬件上跑,保证了低延迟和离线环境下的稳定表现。”有了它,机器人在网络受限的场景,像工厂、仓库或者偏远地区,实用性大大提升。
测试结果显示,它的性能接近云端Gemini Robotics模型,而且在多项基准测试中还超越了其他本地 AI 模型,竞争力十足。
通用又灵活,少量演示就能适应新任务
Gemini Robotics On-Device不仅性能出色,任务适应能力也让人眼前一亮。DeepMind宣称,这个模型只需要50到100 次演示,就能快速适应新任务,比如解拉链、叠衣服或者进行工业装配。
一开始,这个模型是针对 ALOHA 机器人进行训练的,但它已经成功适配了双臂Franka FR3机器人和Apptronik的Apollo人形机器人,这充分展现了它跨硬件平台的通用性。开发者还能通过自然语言指令来控制和微调模型,让它轻松应对复杂的双臂任务或者在动态环境中的新对象。Parada强调:“生成式AI让机器人能从少量数据中泛化,大大加速了在复杂场景中的部署。”
开放开发者生态,SDK助力创新
为了让Gemini Robotics On-Device能在行业里更快地应用起来,Google DeepMind还同步发布了一款软件开发工具包(SDK),现在已经通过GitHub向“受信任测试者”计划开放申请了。
开发者可以利用这个SDK在 Google 的 MuJoCo 物理模拟器或者现实环境中测试和微调模型。这可是DeepMind第一次向开发者开放VLA模型的微调权限,给机器人 AI 的定制化应用铺平了道路。
有了这个SDK,开发者通过少量演示就能快速训练机器人完成特定任务,比如把魔方放进袋子或者处理精细的工业操作。DeepMind表示,这个模型在没见过的新场景和对象上表现也很棒,比如在工业传送带上完成装配任务,泛化能力超强。
安全与前景:机器人AI的未来之路
在安全方面,DeepMind可没含糊,强调Gemini Robotics On-Device通过了一系列全面的安全措施,还和专家、政策制定者合作,努力降低潜在风险。同时,这款模型的发布也让Google在通用机器人AI领域和Nvidia GR00T、OpenAI RT-2等竞争对手的竞争更加激烈了。
从仓库机器人到家用服务机器人,Gemini Robotics On-Device的本地化运行能力和快速学习特性,为它在多个场景中的广泛应用打下了坚实的基础。
可以预见,这一技术不仅能降低机器人部署成本,还可能让AI驱动的自动化走进更多日常生活场景,为我们的生活带来更多便利。
模型地址:https://deepmind.google/discover/blog/gemini-robotics-on-device-brings-ai-to-local-robotic-devices/
想了解AITOP100平台其它版块的内容,请点击下方超链接查看
AI创作大赛 | AI活动 | AI工具集 | AI资讯专区
AITOP100平台官方交流社群二维码: