智谱开源GLM-4.5创SOTA纪录:3550亿参数模型实现100 tokens/s生成速度,API成本低至0.8元/百万tokens

🎯 情报来源:量子位

2025年7月29日,智谱AI发布新一代旗舰大模型GLM-4.5系列,创下开源模型领域三项突破性纪录:首次原生融合推理、代码和Agent三大能力;在12项国际基准测试中综合成绩位列全球第三(开源&国产双第一);以3550亿总参数实现100 tokens/s的行业顶尖生成速度。

该系列包含两个版本:GLM-4.5(3550亿参数/320亿激活参数)和GLM-4.5-Air(1060亿参数/120亿激活参数)。其API定价显著低于市场水平,输入/输出分别仅需0.8元/百万tokens和2元/百万tokens。实测显示,模型可实时生成功能完整的百度搜索、B站视频网站(含弹幕功能)等应用。

💡 核心要点

  • 性能突破:12项基准测试综合平均分开源&国产双第一,代码能力SWE-bench榜单参数效率帕累托最优
  • 架构创新:MoE架构+分组查询RoPE位置编码,参数量仅DeepSeek-R1一半但性能更优
  • 商业价值:API成本较主流模型降低50%+,企业级应用性价比显著提升
  • 技术开源:完整开源模型及强化学习系统Slime,包含52道编程任务测试集
  • 实用验证:52项编程任务测试超越Claude等竞品,成功实现《羊了个羊》游戏一键生成

📌 情报分析

技术价值:极高
采用无损均衡路由MoE架构+Muon优化器,在MMLU/BBH等推理任务中96头注意力设计表现突出。106B参数的GLM-4.5-Air性能媲美Gemini 2.5 Flash。

商业价值:高
API成本优势明显,结合50元/月无限制调用方案,可能快速抢占开发者生态。但需观察实际企业场景中的稳定性表现。

趋势预测:高
验证了参数效率优化的可行性,其MoE架构设计可能影响行业技术路线。开源策略将加速国产模型生态建设,或改变全球开源竞争格局。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索