🎯 情报来源:量子位
2025年7月,大模型竞技场悄然上线名为steve的神秘模型,该模型在对话中自曝来自中国AI公司DeepSeek。据网友测试,steve知识截止时间为2023年10月,在代码生成任务中仅输出300行(V3为800行),且部分智力测试题回答错误。这一表现与传闻中1.2T参数的R2相去甚远。
同期,The Information爆料称DeepSeek CEO梁文锋因对R2效果不满再次延期发布。消息人士透露项目受阻可能涉及英伟达H20芯片短缺问题。此前4月流出的R2参数(1.2T参数/5.2PB数据)尚未得到官方证实。
💡 核心要点
- steve模型自称来自DeepSeek,但代码生成量仅为V3的37.5%(300 vs 800行)
- 知识截止时间锁定2023年10月,较当前主流模型落后20个月
- R2项目二次延期,CEO对模型效果持续不满
- 4月泄露参数显示R2或达1.2T参数规模,使用华为昇腾芯片
- 最新公开模型仍为DeepSeek-R1-0528(2025年5月版)
📌 情报分析
技术价值:一般
steve表现未达预期(智力测试错误/代码量不足),若为R2测试版则反映技术突破有限;若为蒸馏模型则无创新价值
商业价值:高
1.2T参数规模(若属实)将冲击GPT-5竞争格局;华为昇腾适配显国产替代价值
趋势预测:一般
延期显示AGI研发进入深水区,但芯片短缺问题可能持续制约中国大模型发展(参考H20供应困境)
