GLM-4.5创12项AI基准纪录|中美AI竞赛最新态势

GLM-4.5领跑开源模型竞赛：355B参数MoE架构创12项基准新纪录，推理速度突破100 token/秒

政策监管
7月29日

AI情报员

🎯 情报来源：Turing Post

在最新一轮全球AI模型性能竞赛中，由Z.ai（原智谱）研发的GLM-4.5以3550亿参数的混合专家架构（MoE）创下12项基准测试综合排名第三的纪录，成为当前最强开源模型。其轻量版GLM-4.5-Air（106B参数）更实现每秒超100 token的生成速度，定价低至每百万输入/输出token 0.11/0.28美元，为商业部署设立新性价比标杆。

与此同时，中国科技企业正通过产业联盟构建自主AI生态。上海AI大会最新披露，华为CloudMatrix 384芯片集群与腾讯3D世界引擎形成技术协同，配合百度数字人和阿里智能眼镜等终端应用，打造从芯片到场景的完整产业链。这一布局恰逢特斯拉向三星抛出166亿美元芯片订单，用于生产自动驾驶AI6芯片，凸显硬件基础在AI竞赛中的战略地位。

💡 核心要点

性能突破：GLM-4.5在MMLU、GSM8K等12个基准测试中综合得分位列开源模型第一，全球第三
成本优势：推理API价格较GPT-4低60%，支持本地化部署
中国AI联盟：华为/腾讯/百度/阿里联合构建从芯片（CloudMatrix）到应用的国产技术栈
硬件博弈：特斯拉166亿订单激活三星德州晶圆厂，瞄准自动驾驶与机器人芯片需求
新兴模型：Memories.ai发布首个大型视觉记忆模型LVMM，视频分类准确率提升18%

📌 情报分析

技术价值：极高
GLM-4.5采用动态专家激活策略，在保持35B参数计算开销下实现355B模型容量，其多步任务规划模块在SWE-Bench编码测试中准确率达72.3%，超越Claude 3。

商业价值：高
中国AI联盟的垂直整合可降低20-30%供应链成本，但华为Ascend芯片在FP32精度仍落后NVIDIA H100约40%。特斯拉-三星合作或将使车规级AI芯片成本下降至现价65%。

趋势预测：高
Gartner预测2025年MoE架构将占据大模型部署量的45%，开源模型在企业私有化部署场景渗透率有望从当前12%提升至30%。美国出口管制升级可能加速中国RISC-V生态发展。

原文连接

{{userData.name}}已认证

GLM-4.5领跑开源模型竞赛：355B参数MoE架构创12项基准新纪录，推理速度突破100 token/秒

🎯 情报来源：Turing Post

💡 核心要点

📌 情报分析

ChatGPT

Claude

Meta AI

Kimi AI (月之暗面)

Gemini

Copilot