2700万参数HRM模型超越Claude 3.7:00后清华天才仿脑架构颠覆Transformer

🎯 情报来源:量子位

清华大学校友王冠创立的Sapient Intelligence公司近日发布2700万参数分层推理模型HRM,在多项基准测试中超越参数规模更大的主流模型。该模型采用仿脑设计,仅需1000个训练样本即在ARC-AGI测试取得40.3%准确率,显著超过Claude 3.7 8K(21.2%)和o3-mini-high(34.5%)。

在极端数独和30×30迷宫等复杂推理任务中,HRM实现近乎完美准确率,而传统Transformer模型表现不足20%。其核心创新在于分层循环模块设计,通过高低阶模块协同实现时间尺度分离,大幅提升计算效率。

💡 核心要点

  • 参数量仅27M,训练样本1000个,ARC-AGI准确率40.3%
  • 极端数独任务准确率近100%,30×30迷宫任务稳定领先
  • 内存消耗比传统循环模型降低90%,推理效率提升5倍
  • 研发团队Sapient Intelligence已获数千万美元融资
  • 创始人王冠曾拒绝马斯克xAI邀请,专注新型架构研发

📌 情报分析

技术价值:极高 – 分层收敛机制和近似梯度技术突破Transformer计算局限,在特定领域实现参数效率10倍提升

商业价值:高 – 小模型特性适合边缘计算部署,数千万融资显示资本认可,但需验证泛化能力

趋势预测:高 – 仿脑架构或开启新研究范式,论文发布一周内GitHub星标超5000,社区关注度爆发

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索