🎯 情报来源:量子位
8月28日,中文多模态视觉语言模型测评基准(SuperCLUE-VLM)发布最新榜单。百度ERNIE-4.5-Turbo-VL多模态大模型以66.47分的成绩并列位居国内模型第一,在真实场景任务下的领先优势明显。本次评估覆盖Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)等国内外15款多模态模型。
测评结果显示,Gemini-2.5-Pro以总分74.99分领先全球,OpenAI GPT-5(high)以68.59分位居第二。分析人士指出,文心大模型在多模态领域的多维度领先优势突出,国内头部模型在视觉推理、视觉应用等高阶任务上的进步显著。
💡 核心要点
- 百度ERNIE-4.5-Turbo-VL以66.47分并列国内第一
- 全球前三:Gemini-2.5-Pro(74.99分)、GPT-5(high)(68.59分)、文心4.5 Turbo(66.47分)
- 评测覆盖15款国内外多模态模型,聚焦基础认知、视觉推理、视觉应用三大维度
- 文心大模型开发者超2185万,服务67万家企业,创建模型达110万
- 6月30日百度开源文心4.5系列10款模型,支持100+语言交互
📌 情报分析
技术价值:高 – 文心4.5 Turbo在视觉推理等高阶任务表现突出,支持100+语言交互,跨模态能力覆盖文档、视频等核心场景。
商业价值:极高 – 百度全栈自研体系支撑,飞桨文心开发者达2185万,服务67万企业,商业化落地规模领先。
趋势预测:高 – 国内多模态模型进步显著,文心4.5系列开源策略有望加速生态构建,缩小与国际领先模型的差距。
