🎯 情报来源:量子位
阿里云近日披露国内首支专业AI安全攻防团队——AI蓝军,该团队通过模拟Morris II级AI蠕虫攻击,揭示大模型时代新型安全威胁。团队在2025年「AI安全」全球挑战赛中,成功演示通过心理诱导使大模型执行恶意脚本,暴露AI系统在间接提示注入、跨模态隐写等领域的12类思维盲区。
据负责人石肖雄透露,团队已建立包含攻击成功率、修复难度等6维度的新型评估体系,防御团队通过”以模治模”策略,将典型越狱攻击拦截率提升至92%。目前团队累计发现47种全新攻击向量,推动阿里云大模型安全架构完成3次重大迭代。
💡 核心要点
- 国内首个企业级AI蓝军团队,专注大模型”思维漏洞”攻防
- 发现47种新型攻击向量,包括跨模态隐写等12类思维盲区
- 建立6维度评估体系(影响/复现性/新颖性/隐蔽性/自动化/修复难度)
- 典型越狱攻击拦截率提升至92%,安全架构完成3代迭代
- 2025全球挑战赛揭示:心理诱导攻击成功率高达78%
📌 情报分析
技术价值:极高
发现Morris II级AI蠕虫防御方案,首创”思维漏洞”检测体系,推动多模态安全检测技术发展
商业价值:高
构建AI时代新型安全服务壁垒,预计可降低企业AI部署风险成本35%以上
趋势预测:极高
2026年全球AI安全市场规模将突破$50亿,思维层攻防技术成头部云厂商标配
