🎯 情报来源:量子位
2025年8月27日,元戎启行正式发布全球首个面向量产车的VLA(视觉语言动作)模型方案,标志着辅助驾驶进入GPT架构新时代。该方案已获5款车型定点,预计年内搭载量达20万台,并将成本下探至15万元级车型,直接冲击车企动辄数亿元的自研预算。
CEO周光将传统CNN架构比作”尼安德特人”,而VLA则是具备思维链的”智人”——虽然当前版本仅自评6分(满分10分),但其下限已超越传统方案上限。关键技术突破包括:基于700TOPS算力平台(如英伟达Thor)实现防御性驾驶决策、长时序推理能力,以及首次在车规级场景应用GPT架构的Transformer模型。
💡 核心要点
- 商业突破:直接降低车企VLA研发门槛,替代数亿级自研投入,首批5款合作车型已确定
- 技术指标:需最低700TOPS算力(Orin平台无法支持),帧率10-20FPS,支持多芯片平台适配
- 成本控制:方案可下沉至15万元车型,10万级通过优化有望搭载
- 数据积累:现有10万台端到端1.0量产车提供训练数据,融合真实道路与生成数据
- 行业影响:特斯拉AI5芯片(2500TOPS)等大算力方案验证GPT架构必要性
📌 情报分析
技术价值:极高
从CNN转向GPT架构属于范式革命,思维链和语言理解能力突破BEV空间局限。但需验证复杂场景下的幻觉控制(采用后训练对齐技术)
商业价值:高
直接节省车企研发成本,20万台量产规模形成数据闭环。但700TOPS算力要求可能限制早期渗透率
趋势预测:极高
特斯拉/小鹏已跟进大算力路线,Transformer架构将成为行业标准。周光预测”传统自动驾驶等级划分已过时”,推理能力才是核心指标
