DeepSeek-R2疑云:神秘模型steve现身竞技场,性能不及V3引猜测

🎯 情报来源:量子位

2025年7月,大模型竞技场悄然上线名为steve的神秘模型,该模型在对话中自曝来自中国AI公司DeepSeek。据网友测试,steve知识截止时间为2023年10月,在代码生成任务中仅输出300行(V3为800行),且部分智力测试题回答错误。这一表现与传闻中1.2T参数的R2相去甚远。

同期,The Information爆料称DeepSeek CEO梁文锋因对R2效果不满再次延期发布。消息人士透露项目受阻可能涉及英伟达H20芯片短缺问题。此前4月流出的R2参数(1.2T参数/5.2PB数据)尚未得到官方证实。

💡 核心要点

  • steve模型自称来自DeepSeek,但代码生成量仅为V3的37.5%(300 vs 800行)
  • 知识截止时间锁定2023年10月,较当前主流模型落后20个月
  • R2项目二次延期,CEO对模型效果持续不满
  • 4月泄露参数显示R2或达1.2T参数规模,使用华为昇腾芯片
  • 最新公开模型仍为DeepSeek-R1-0528(2025年5月版)

📌 情报分析

技术价值:一般
steve表现未达预期(智力测试错误/代码量不足),若为R2测试版则反映技术突破有限;若为蒸馏模型则无创新价值

商业价值:高
1.2T参数规模(若属实)将冲击GPT-5竞争格局;华为昇腾适配显国产替代价值

趋势预测:一般
延期显示AGI研发进入深水区,但芯片短缺问题可能持续制约中国大模型发展(参考H20供应困境)

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索