🎯 情报来源:The Robot Report
Google DeepMind本周推出了一款用于通用灵巧性和快速任务适应的设备端Gemini Robotics模型。这款名为Gemini Robotics On-Device的模型基于Vision-Language-Action (VLA)架构,能够在物理世界中实现Gemini 2.0的多模态推理和现实世界理解能力。
核心要点:
- Gemini Robotics On-Device是一款针对双臂机器人优化的基础模型,可在设备端独立运行,适用于延迟敏感的应用程序场景
- 模型支持开发者通过50-100次演示快速适配新领域,并已在MuJoCo物理模拟器中完成测试
- 在7项灵巧操作任务测试中表现优异,包括拉上饭盒拉链、抽卡和倒沙拉酱等高难度动作
- 已成功适配ALOHA、Franka FR3和Apollo人形机器人等多种硬件平台
- 目前仅向受信任的测试人员开放,配套提供SDK开发工具包
📌 情报分析
技术价值:高
模型展示了在多机器人平台的通用适配能力,在7项灵巧操作任务中均表现优异,且支持仅50-100次演示的新领域快速适配。
商业价值:高
设备端运行特性使其适用于工业自动化等延迟敏感场景,已成功验证在装配线等工业应用中的潜力。
趋势预测:
未来3-6个月可能扩展至更多机器人硬件平台,并逐步向特定行业客户开放商业化应用。