OpenAI发布ChatGPT智能代理功能:红队测试揭露7大漏洞,安全防御率达95%

🎯 情报来源:AI News | VentureBeat

OpenAI昨日为付费订阅用户推出名为”ChatGPT智能代理”的新功能,允许AI直接操作用户邮箱、编辑文件及执行网页操作。该功能引发重大安全隐忧,OpenAI安全研究团队成员Keren Gu在X平台表示,已激活最高级别安全防护,并首次将模型在生物化学领域的风险等级定为”高能力”。

为应对风险,OpenAI组建16名生物安全领域博士组成的红队进行40小时压力测试,共提交110次攻击尝试,其中16次突破内部风险阈值,发现7个通用漏洞。测试促使OpenAI重构安全架构,最终实现95%的视觉浏览器攻击防御率,生物相关内容识别准确率达96%。

💡 核心要点

  • 红队测试发现7个通用漏洞,其中16次攻击突破风险阈值
  • 部署实时监控系统实现100%流量覆盖,漏洞修复速度提升至数小时级
  • 生物安全防护达行业标杆:96%内容识别率+84%武器化内容监测率
  • 禁用敏感场景下的记忆功能,网络访问限制为GET请求
  • 预发布阶段已修复16个关键漏洞,防御95%已知攻击向量

📌 情报分析

技术价值(极高):双层级实时监控架构(首层96%召回率+二层84%召回率)和快速补丁协议确立AI安全新标准。

商业价值(高):企业级用户安全基准明确,但记忆功能禁用影响用户体验,可能限制初期采用率。

趋势预测(高):红队测试将成为AI产品标准流程,生物安全防护需求将推动专项漏洞赏金计划发展。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索