中国Z.ai发布开源大模型GLM-4.5系列:12项基准测试全球第三,推理能力比肩Claude 4 Opus

🎯 情报来源:AI News | VentureBeat

中国AI初创公司Z.ai近日发布开源大模型GLM-4.5系列,包含旗舰型号GLM-4.5及其轻量版GLM-4.5-Air。根据官方披露,该系列在12项行业基准测试中综合排名第三,仅次于GPT-4和Grok 4,推理能力超越Claude 4 Opus(BrowseComp测试26.4% vs 18.8%)。

两款模型均采用混合专家架构(MoE),其中GLM-4.5具备3550亿总参数/320亿活跃参数,其轻量版配置为1060亿/120亿参数。通过Apache 2.0许可证发布,支持商用部署和自主微调,API定价最低至每百万token 0.11美元。

💡 核心要点

  • 性能表现:12项基准测试总排名第三,BrowseComp网页任务26.4%准确率超越Claude 4 Opus
  • 架构创新:采用无损平衡路由的MoE架构,推理任务中工具调用成功率90.6%
  • 商业价值:Apache 2.0许可商用,API成本较竞品低50%(0.11美元/百万token)
  • 硬件效率:仅需8块NVIDIA H20 GPU即可运行,硬件需求为竞品50%
  • 融资规模:累计融资超15亿美元,投资方含阿里、腾讯及沙特阿美旗下基金

📌 情报分析

技术价值:极高
模型在SWE-bench编码测试达到64.2%成功率,工具调用可靠性90.6%,采用自适应课程学习等前沿训练技术。

商业价值:高
开源许可证降低企业使用门槛,API价格仅为Claude 4的1/5,但需注意中国数据合规限制。

趋势预测:高
中国开源模型集群效应显现(阿里Qwen3同期发布),可能加速全球开源生态向亚太转移。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索