🎯 情报来源:The Verge
Google DeepMind发布了其Gemini Robotics AI模型的离线版本,该版本无需互联网连接即可运行。这款视觉-语言-动作模型(VLA)具备与3月发布的版本相似的灵巧能力,但Google表示它“足够小巧高效,可以直接在机器人上运行”。
旗舰版Gemini Robotics模型旨在帮助机器人完成各种物理任务,即使未经过专门训练。它能让机器人泛化新情境、理解并响应指令,以及执行需要精细动作技能的任务。
核心要点:
- 离线版Gemini Robotics模型仅需50-100次演示即可适应新任务。
- 模型最初在ALOHA机器人上训练,但已成功适配Apptronik的人形Apollo机器人和Franka FR3双臂机器人。
- Google同时发布了该离线模型的软件开发工具包(SDK),供开发者评估和微调。
- 离线模型性能接近旗舰版,但更适合网络连接不佳或安全要求严格的场景。
📌 情报分析
技术价值:高
离线运行能力结合50-100次演示的快速适应性能,显著提升了机器人在无网络环境的实用性。
商业价值:高
SDK的发布和跨平台适配能力降低了开发者门槛,潜在应用于工业、医疗等高安全需求领域。
趋势预测:
未来3-6个月内,随着测试范围扩大,该技术可能加速渗透至制造业自动化、仓储物流等离线场景。
