谷歌DeepMind推出本地化机器人AI模型 可独立完成高精度任务
6月25日,谷歌DeepMind宣布推出Gemini Robotics On-Device,这是一款可在机器人设备本地运行的AI模型,无需依赖云端即可执行复杂任务,如系鞋带、叠衣服、打开拉链等高难度操作。该技术基于视觉-语言-动作(VLA)架构,旨在提升机器人的自主性和响应速度,适用于医疗、家庭服务等网络不稳定的场景。
传统机器人AI通常依赖云端计算,而Gemini Robotics On-Device直接在设备端处理数据,大幅降低延迟,确保任务执行的实时性。谷歌表示,该模型尤其适合手术辅助机器人、工业机械臂等对稳定性要求极高的场景。
该AI支持双机械臂协同操作,可完成精细动作,如系鞋带、整理衣物等。目前适配的机器人包括: ALOHA(开源机器人平台)、Franka FR3(工业协作机械臂)、Apollo(人形机器人)。DeepMind强调,该模型不仅能执行预设任务,还能通过少量演示(50-100次)学习新技能,适应不同场景需求。
谷歌同步推出Gemini Robotics SDK,开发者可利用该工具包训练机器人执行定制任务,并借助MuJoCo物理模拟器进行测试。此外,系统内置多重安全机制:Live API 实时检测语义安全,防止错误操作、底层安全控制器 限制力度与速度,避免意外伤害、开放语义安全基准测试框架,供开发者优化模型。
DeepMind机器人项目负责人Carolina Parada表示,该模型借鉴了Gemini多模态AI的世界理解能力,能像生成文本、代码一样“生成”机器人动作。目前,该技术仅向可信测试计划的开发者开放,基于Gemini 2.0架构(未采用最新的2.5版本),未来或逐步向更广泛领域推广。