RockAI发布Yan 2.0 Preview:非Transformer架构大模型实现原生记忆与离线智能,树莓派多模态问答达5 tokens/s

🎯 情报来源:量子位

在2025年WAIC大会上,成立仅两年的RockAI展示了其非Transformer架构大模型Yan 2.0 Preview的突破性进展。该模型在完全离线状态下实现机器狗实时学习新动作、灵巧手自主玩策略游戏等能力,核心在于创新的”原生记忆”模块和训推同步机制。现场实测显示,Yan 2.0 Preview在树莓派上可实现5 tokens/s的多模态问答速度。

据创始人刘凡平透露,RockAI自2022年起便放弃Transformer架构,专注端侧AI开发。目前其模型已适配树莓派、骁龙6系芯片及机器人主控芯片,并与某出海品牌达成AI PC量产合作,预计下半年上市。CTO杨华明确表示:”Transformer架构从一开始就注定不适合端侧设备”。

💡 核心要点

  • 原生记忆突破:Yan 2.0 Preview实现动态知识更新与检索,支持边用边学
  • 端侧性能标杆:树莓派运行多模态问答达5 tokens/s,完全离线
  • 商业落地加速:AI PC下半年量产,覆盖机器人/手机/IoT多终端
  • 架构革新:绕过Transformer自注意力机制,计算复杂度降为线性
  • 训推同步机制:模型权重实时更新,较传统方法内存占用减少50%

📌 情报分析

技术价值:极高
原生记忆模块实现动态权重更新,在树莓派等边缘设备验证了可行性,突破Transformer的二次复杂度瓶颈。

商业价值:高
已获硬件厂商订单,AI PC产品路线图明确。但端侧AI市场教育仍需时间,短期难以挑战云端主导地位。

趋势预测:高
谷歌MoR等架构革新频现,反映行业对Transformer替代方案的需求。端侧AI市场规模预计2027年达$12.6B(CAGR 29.3%)。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索