🎯 情报来源:量子位
在2025年WAIC大会上,阶跃星辰正式发布新一代开源多模态大模型Step 3,以321B总参数规模刷新开源多模态推理模型SOTA记录。该模型将于7月31日开源,在MMMU等基准测试中表现突出,其核心创新在于通过Model-system Co-design架构实现显著成本优势——A800芯片上推理成本低于所有竞品,H20芯片上成本仅为DeepSeek-V3的30%。
特别值得注意的是,Step 3针对国产芯片进行深度优化,在华为昇腾等国产硬件上推理效率最高可达DeepSeek-R1的300%。目前已有包括OPPO、吉利银河等10家终端厂商接入,2025年预计商业化收入将达10亿人民币。
💡 核心要点
- 性能突破:321B参数MoE架构,视觉编码器5B+语言模型316B,激活参数38B
- 成本优势:AFD分布式推理系统+MFA注意力机制,H20芯片推理成本仅DeepSeek-V3的30%
- 国产适配:华为昇腾/沐曦等国产芯片完整适配,效率达DeepSeek-R1的300%
- 商业落地:已部署至吉利汽车/TOP10手机厂商,2025年预期收入10亿元
- 开源承诺:7月31日全面开源,GitHub仓库已获107星关注
📌 情报分析
技术价值:极高
AFD分布式推理系统实现Attention-FFN解耦部署,配合MFA低秩注意力机制,KV缓存小于DeepSeek-V3,算术强度精准控制在128,在32张Hopper GPU上实现4039 tokens/GPU/s吞吐量。
商业价值:高
已形成汽车/手机/IoT三大落地场景,终端Agent部署验证商业模式可行性。但10亿收入目标需验证终端用户付费转化率。
趋势预测:极高
牵头成立「模芯生态联盟」整合10家芯片厂商,FP8全量化技术提前布局下一代低比特计算生态,国产化适配策略符合供应链安全趋势。