🎯 情报来源:量子位
OpenAI于2025年7月18日正式发布ChatGPT Agent,该智能体首次实现Operator操作执行能力与深度研究分析能力的统一,可接管用户电脑完成工作生活全场景任务。Pro/Plus/Team版用户即日可用,其中Pro版支持无限次任务执行,其他付费用户每月50次额度。
在技术性能方面,ChatGPT Agent在超难测试集「人类最后的考试」中取得41.6分(原记录<10分),在DSBench数据分析任务中超越人类水平,SpreadsheetBench电子表格处理能力较GPT-4o提升超100%至45.5%。OpenAI特别开发专用模型实现动态学习优化,配备可视化/文本浏览器及API三重交互路径。
💡 核心要点
- 任务执行能力:支持会议改期、PPT生成、差旅报销等16项高管级工作场景,以及旅游规划、活动筹备等生活场景
- 性能突破:在三大专业测试集(41.6分/人类水平/45.5%)全面刷新SOTA纪录
- 商业模式:Pro版无限次执行,其他付费用户50次/月,企业/教育版7月开放
- 安全机制:实时风险监测拦截生物/金融/法律等高危请求,禁用记忆功能防滥用
- 行业影响:直接冲击Agent创业赛道,将垂直功能整合为「工具按钮」级解决方案
📌 情报分析
技术价值:极高 – 首次实现操作执行与深度研究的系统级整合,专用模型在三大专业测试集确立新标杆
商业价值:高 – 企业级场景渗透率有望快速提升(测试显示电子表格处理效率翻倍),但免费用户暂未覆盖
趋势预测:极高 – 标志着AI从「辅助工具」向「操作系统」演进,参照移动互联网发展轨迹,Agent或重构现有APP生态
