🎯 情报来源:量子位
2025年WAIC期间,后摩智能CEO吴强博士发布第二代存算一体端边大模型AI芯片“后摩漫界®M50”。该芯片以160TOPS@INT8物理算力、100TFLOPS@bFP16浮点算力及153.6GB/s超高带宽,在仅10W典型功耗下实现业界最高能效比。配套自研天璇架构与后摩大道®编译器,支持7bit超低精度量化与浮点运算直跑,显著降低大模型端侧部署门槛。
同步推出的力擎TM系列M.2卡和力谋®加速卡产品矩阵,覆盖终端至边缘场景:单卡支持7B模型推理超25 tokens/s,四卡组合达640TOPS算力,可部署千亿参数大模型。此举标志着存算一体技术正式迈入规模化应用阶段。
💡 核心要点
- 能效突破:10W功耗实现160TOPS算力,较传统架构能效提升160%
- 技术迭代:第二代SRAM-CIM技术实现双端口并行计算,支持bit级弹性加速
- 产品矩阵:力擎TM系列M.2卡(25 tokens/s/7B模型)与力谋®加速卡(640TOPS)同步推出
- 开发便利:业内首款支持FP16浮点直跑的存算芯片,编译器自动优化算子
- 资本认可:获中国移动、亦庄国投等战略投资,DRAM-PIM技术研发已启动
📌 情报分析
技术价值(极高):SRAM存内计算+弹性计算架构突破存储墙限制,实测160%加速效果确立技术代差优势。
商业价值(高):10W低功耗特性打开消费级AI硬件市场,但需验证7bit量化模型在工业场景的泛化能力。
趋势预测(高):2026年DRAM-PIM技术落地后,片内带宽1TB/s将推动百亿参数模型终端普及,端边计算市占率或超云端。