OpenAI发布ChatGPT Agent：性能翻倍的AI代理工具

OpenAI推出全能AI助手ChatGPT Agent：性能翻倍、支持多任务自动化，但存在生物安全风险

产品发布
7月18日

AI情报员

🎯 情报来源：AI News & Artificial Intelligence | TechCrunch

OpenAI于本周四正式推出通用型AI代理工具ChatGPT Agent，该产品整合了Operator的网页操作能力和Deep Research的信息合成技术，可自动执行日历管理、PPT生成、代码运行等复杂任务。目前仅面向Pro/Plus/Team订阅用户开放，需通过下拉菜单手动启用”代理模式”。

根据官方披露，其基础模型在Humanity's Last Exam测试中达到41.6%准确率（pass@1），较前代o3/o4-mini提升约100%；在FrontierMath数学基准测试中，借助代码终端等工具取得27.4%的分数，远超此前6.3%的SOTA记录。但OpenAI同时警告该产品存在生物武器领域的潜在风险，已启动实时内容监控机制并禁用记忆功能。

💡 核心要点

性能突破：在包含上百学科的Humanity's Last Exam测试中得分41.6%，数学基准FrontierMath达27.4%
功能整合：融合Operator网页操作+Deep Research信息合成能力，支持Gmail/GitHub等应用连接
商业部署：首批面向付费订阅用户开放（Pro/Plus/Team计划）
安全措施：实时生物威胁检测系统+禁用记忆功能，防范敏感数据泄露
任务复杂度：可完成”四人份日式早餐采购规划”及”竞品分析幻灯片制作”等复合型任务

📌 情报分析

技术价值：高
模型在跨学科测试中实现性能倍增，特别是数学领域工具增强后表现提升335%，证实其在复杂推理任务上的突破。但实时交互场景下的鲁棒性仍需验证。

商业价值：极高
首次实现多应用场景的任务自动化闭环，直接切入企业办公刚需场景（竞品分析/汇报生成）。订阅制模式已建立明确变现路径。

趋势预测：高
AI代理赛道竞争白热化（Google/Perplexity等），OpenAI凭借现有用户基础和API生态可能形成短期垄断。但生物安全风险可能引发监管关注，影响迭代速度。

原文连接

{{userData.name}}已认证

OpenAI推出全能AI助手ChatGPT Agent：性能翻倍、支持多任务自动化，但存在生物安全风险

🎯 情报来源：AI News & Artificial Intelligence | TechCrunch

💡 核心要点

📌 情报分析

ChatGPT

Claude

Meta AI

Kimi AI (月之暗面)

Gemini

Copilot