OpenAI通用推理模型IOI夺金全球第六,中国高中生包揽人类前三

🎯 情报来源:量子位

OpenAI在2025年国际信息学奥林匹克竞赛(IOI)线上AI赛道中,其整合的通用推理模型以533.29分排名全球第六(含人类选手),在AI参赛者中位列第一。值得注意的是,该成绩较2024年专用模型o1-ioi的213分实现150%的跃升,且未进行针对性训练。人类选手中,中国高中生刘恒熙、范斯喆、陈昕阳包揽前三名,金牌分数线为438.30分。

竞赛采用严苛标准:5小时限时、50次提交限制、全程断网。OpenAI通过集成多个推理模型生成候选程序并筛选最优解,未使用检索增强技术。同期马斯克发布的IOI Benchmark显示,Grok 4在编码任务上超越GPT-5。

💡 核心要点

  • 总分533.29分,超越98%的330名人类选手,AI赛道第一
  • 未专门训练通用模型,成绩较2024年专用模型(o1-ioi)提升150%
  • 中国高中生包揽人类前三:刘恒熙(镇海中学)、范斯喆(海亮高级中学)、陈昕阳(杭州二中)
  • 竞赛限制:5小时/50次提交,全程断网禁用RAG技术
  • GPT-5在LiveCodeBench Pro测试中唯一解出难题分组,平均响应达10万token

📌 情报分析

技术价值:极高
通用模型未针对性训练即超越专用模型表现,证明多模型协同推理能力突破。50次提交限制下达到人类顶尖水平,算法优化效能显著。

商业价值:高
竞赛级推理能力可直接转化至代码生成、数学建模等场景。但GPT-5在LiveCodeBench Pro的10万token长响应显示工程化落地仍需优化。

趋势预测:高
通用模型竞赛表现持续提升将加速AI替代初级编程工作。中国选手统治级表现反映亚洲区信息学教育优势,未来AI训练数据地域差异可能扩大。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索