阶跃Step 3发布:321B参数开源多模态SOTA模型,推理成本仅DeepSeek 1/3,国产芯片适配效率达300%

🎯 情报来源:量子位

在2025年WAIC大会上,阶跃星辰正式发布新一代开源多模态大模型Step 3,以321B总参数规模刷新开源多模态推理模型SOTA记录。该模型将于7月31日开源,在MMMU等基准测试中表现突出,其核心创新在于通过Model-system Co-design架构实现显著成本优势——A800芯片上推理成本低于所有竞品,H20芯片上成本仅为DeepSeek-V3的30%。

特别值得注意的是,Step 3针对国产芯片进行深度优化,在华为昇腾等国产硬件上推理效率最高可达DeepSeek-R1的300%。目前已有包括OPPO、吉利银河等10家终端厂商接入,2025年预计商业化收入将达10亿人民币。

💡 核心要点

  • 性能突破:321B参数MoE架构,视觉编码器5B+语言模型316B,激活参数38B
  • 成本优势:AFD分布式推理系统+MFA注意力机制,H20芯片推理成本仅DeepSeek-V3的30%
  • 国产适配:华为昇腾/沐曦等国产芯片完整适配,效率达DeepSeek-R1的300%
  • 商业落地:已部署至吉利汽车/TOP10手机厂商,2025年预期收入10亿元
  • 开源承诺:7月31日全面开源,GitHub仓库已获107星关注

📌 情报分析

技术价值:极高
AFD分布式推理系统实现Attention-FFN解耦部署,配合MFA低秩注意力机制,KV缓存小于DeepSeek-V3,算术强度精准控制在128,在32张Hopper GPU上实现4039 tokens/GPU/s吞吐量。

商业价值:高
已形成汽车/手机/IoT三大落地场景,终端Agent部署验证商业模式可行性。但10亿收入目标需验证终端用户付费转化率。

趋势预测:极高
牵头成立「模芯生态联盟」整合10家芯片厂商,FP8全量化技术提前布局下一代低比特计算生态,国产化适配策略符合供应链安全趋势。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索