🎯 情报来源:AI News & Artificial Intelligence | TechCrunch
OpenAI于本周四正式推出旗舰AI模型GPT-5,该模型将作为ChatGPT新一代核心引擎。作为首个”统一型”AI模型,GPT-5融合了o系列的推理能力与GPT系列的响应速度,标志着ChatGPT从聊天工具向代理型AI系统的转型。值得注意的是,GPT-5将首次作为默认模型向所有免费用户开放,覆盖ChatGPT每周7亿用户中的非付费群体。
根据官方披露,GPT-5在编程领域表现突出,在SWE-bench测试中首试得分74.9%,略超Claude Opus 4.1(74.5%);医疗问答场景下思考版幻觉率仅1.6%,较GPT-4o的12.9%显著改善。不过其代理能力测试表现参差,在航空网站导航任务(63.5%)略逊于前代o3模型(64.8%)。
💡 核心要点
- 性能突破:编程测试SWE-bench得分74.9%,医疗问答幻觉率1.6%,代理任务最高分81.1%
- 用户覆盖:免费用户首次获推理模型访问权,覆盖每周7亿活跃用户
- 商业定价:API基础版每百万输入/输出token定价1.25/10美元,Pro订阅月费200美元
- 安全提升:欺骗行为发生率低于前代,危险请求拦截准确率提高
- 多模态支持:新增4种响应人格(愤世者/机器人/倾听者/极客)
📌 情报分析
技术价值:极高
在编程、医疗等核心领域建立新标杆,特别是”氛围编程”能力突破,SWE-bench得分较竞品优势明显(+0.4% vs Claude)。幻觉率从GPT-4o的20.6%降至4.8%,解决行业核心痛点。
商业价值:高
免费策略可巩固市场占有率(当前周活7亿),但API定价策略(1.25美元/百万token)较GPT-4降价30%,可能影响短期ARPU。企业版部署将加速B端渗透。
趋势预测:高
“代理型AI”定位明确,任务完成度测试(Tau-bench)81.1%表现预示工作流自动化将成下阶段竞争焦点。开源模型gpt-oss与商业版形成互补生态,可能重塑开发者社区格局。