蚂蚁开源万亿参数思考模型Ring-1T:数学能力对标IMO银牌,逼近GPT-5

🎯 情报来源:量子位

10月14日,蚂蚁集团正式发布并开源万亿参数思考模型Ring-1T,其数学推理能力达到IMO银牌水平,综合性能逼近GPT-5。该模型基于Ling 2.0架构的1T base模型,采用自研”棒冰(icepop)”算法解决万亿参数模型的训推精度差异问题,并在Arena-Hard V2人类偏好对齐测试中以81.59%的成功率位居开源模型榜首。

在IMO2025赛题测试中,Ring-1T一次解出第1、3、4、5题,几何证明题接近满分,第六题答案收敛至与Gemini 2.5 Pro相同的”4048″(正确答案为2112)。医疗问答HealthBench测评中,Ring-1T也取得开源领域最高分。

💡 核心要点

  • 万亿参数规模:采用Ling 2.0架构,1/32专家激活比,支持FP8混合精度
  • 数学推理能力:一次解出IMO2025四道题,达到银牌水平
  • 性能指标:Arena-Hard V2测试81.59%成功率,逼近GPT-5-Thinking(High)的82.91%
  • 技术创新:自研”棒冰”算法解决训推差异,ASystem实现显存秒级回收
  • 开源策略:全面开放模型权重、训练配方,支持HuggingFace/魔搭社区下载

📌 情报分析

技术价值:极高
自研icepop算法和ASystem系统突破万亿参数模型稳定性难题,IMO银牌级数学能力验证其复杂推理优势。

商业价值:高
形成160亿至1万亿参数的全产品矩阵,医疗等垂直领域表现突出,开源策略加速生态构建。

趋势预测:高
RLVR+RLHF多阶段训练范式可能成为行业标准,万亿参数模型开源将推动AI基础设施升级。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索