Google DeepMind发布Gemini Robotics On-Device模型,实现低延迟机器人操作

🎯 情报来源:The Robot Report

Google DeepMind本周推出了一款用于通用灵巧性和快速任务适应的设备端Gemini Robotics模型。这款名为Gemini Robotics On-Device的模型基于Vision-Language-Action (VLA)架构,能够在物理世界中实现Gemini 2.0的多模态推理和现实世界理解能力。

核心要点:

  • Gemini Robotics On-Device是一款针对双臂机器人优化的基础模型,可在设备端独立运行,适用于延迟敏感的应用程序场景
  • 模型支持开发者通过50-100次演示快速适配新领域,并已在MuJoCo物理模拟器中完成测试
  • 在7项灵巧操作任务测试中表现优异,包括拉上饭盒拉链、抽卡和倒沙拉酱等高难度动作
  • 已成功适配ALOHA、Franka FR3和Apollo人形机器人等多种硬件平台
  • 目前仅向受信任的测试人员开放,配套提供SDK开发工具包

📌 情报分析

技术价值:高

模型展示了在多机器人平台的通用适配能力,在7项灵巧操作任务中均表现优异,且支持仅50-100次演示的新领域快速适配。

商业价值:高

设备端运行特性使其适用于工业自动化等延迟敏感场景,已成功验证在装配线等工业应用中的潜力。

趋势预测:

未来3-6个月可能扩展至更多机器人硬件平台,并逐步向特定行业客户开放商业化应用。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索