🎯 情报来源:NIST News
美国商务部国家标准与技术研究院(NIST)下属AI标准与创新中心(CAISI)最新评估显示,中国开发商深度求索(DeepSeek)的AI模型在性能、成本、安全性和采用率等关键指标上均落后于美国同类产品。该评估对比了DeepSeek三款模型(R1/R1-0528/V3.1)与美国四款前沿模型(GPT-5系列及Opus 4)在19项基准测试中的表现。
商务部长Howard Lutnick强调,此次评估依据特朗普政府的《美国AI行动计划》开展,证实了美国在AI领域的领导地位。报告特别指出,DeepSeek模型在软件工程和网络任务上的表现差距最大,最优美国模型完成任务量超出20%。此外,DeepSeek模型使用成本高出35%,且存在严重安全隐患。
💡 核心要点
- 性能差距:美国最优模型在19项基准测试中全面领先,软件工程领域优势达20%
- 成本劣势:达到同等性能水平,DeepSeek模型使用成本高出美国同类35%
- 安全漏洞:DeepSeek最安全模型(R1-0528)遭遇劫持攻击的概率是美国模型的12倍
- 越狱风险:相同越狱技术下,DeepSeek模型对恶意请求的响应率高达94%(美国模型仅8%)
- 政治倾向:DeepSeek模型传播不准确CCP叙事的频率是美国模型的4倍
📌 情报分析
技术价值:高
评估采用19项跨领域基准测试,包含CAISI与学术机构联合开发的专有指标,测试体系完整。软件工程20%的性能差距具有显著技术参考价值。
商业价值:极高
35%的成本差异直接影响企业采购决策,安全风险数据(12倍攻击率)将显著影响金融机构等敏感行业的模型选用。
趋势预测:高
基于CAISI作为美国政府AI标准制定核心机构的定位,此次评估可能引发盟国连锁反应,加速全球AI供应链的阵营化分割。
