OpenAI发布GPT-5-Codex:动态思考时间达7小时,SWE-bench性能超越GPT-5

🎯 情报来源:AI News & Artificial Intelligence | TechCrunch

OpenAI于本周一宣布推出新版AI编程代理Codex的核心模型GPT-5-Codex。该模型采用动态”思考”机制,单任务处理时间可从数秒延展至7小时,在SWE-bench代理编码基准测试中表现优于GPT-5基础模型。目前该模型已向ChatGPT Plus/Pro/Business/Edu/Enterprise用户开放,未来将扩展至API客户。

此次升级旨在应对日益激烈的AI编程工具市场竞争。据披露,竞品Cursor在2025年初ARR已突破5亿美元,而同类产品Windsurf团队近期被谷歌与Cognition分拆收购。GPT-5-Codex通过动态调整计算资源分配,在代码重构和代码审查任务中展现出显著优势,据工程师评估其高价值评论数量提升明显。

💡 核心要点

  • 思考时长动态调节:单任务处理时间支持秒级至7小时的弹性伸缩
  • 性能突破:SWE-bench代理编码测试成绩超越GPT-5基础模型
  • 商业覆盖:已面向5类Chat付费用户开放,API版本即将推出
  • 市场对标:竞品Cursor年经常性收入突破5亿美元(2025Q1)
  • 审查优化:经工程师验证的高价值代码审查评论数量增加

📌 情报分析

技术价值:极高
动态计算资源分配机制实现量级突破,7小时长程任务处理能力为行业首创,SWE-bench测试数据提供实证支持

商业价值:高
覆盖ChatGPT全系付费用户群体,但需面对Cursor等竞品已建立的5亿美元级市场壁垒

趋势预测:高
弹性计算架构可能成为AI编程工具新标准,代码审查场景的商业化潜力有待释放(基于高价值评论提升的数据)

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索