🎯 情报来源:量子位
清华大学校友王冠创立的Sapient Intelligence公司近日发布2700万参数分层推理模型HRM,在多项基准测试中超越参数规模更大的主流模型。该模型采用仿脑设计,仅需1000个训练样本即在ARC-AGI测试取得40.3%准确率,显著超过Claude 3.7 8K(21.2%)和o3-mini-high(34.5%)。
在极端数独和30×30迷宫等复杂推理任务中,HRM实现近乎完美准确率,而传统Transformer模型表现不足20%。其核心创新在于分层循环模块设计,通过高低阶模块协同实现时间尺度分离,大幅提升计算效率。
💡 核心要点
- 参数量仅27M,训练样本1000个,ARC-AGI准确率40.3%
- 极端数独任务准确率近100%,30×30迷宫任务稳定领先
- 内存消耗比传统循环模型降低90%,推理效率提升5倍
- 研发团队Sapient Intelligence已获数千万美元融资
- 创始人王冠曾拒绝马斯克xAI邀请,专注新型架构研发
📌 情报分析
技术价值:极高 – 分层收敛机制和近似梯度技术突破Transformer计算局限,在特定领域实现参数效率10倍提升
商业价值:高 – 小模型特性适合边缘计算部署,数千万融资显示资本认可,但需验证泛化能力
趋势预测:高 – 仿脑架构或开启新研究范式,论文发布一周内GitHub星标超5000,社区关注度爆发