腾讯混元图像3.0登顶全球文生图榜首:80B参数开源模型超越谷歌Nano Banana

🎯 情报来源:量子位

2025年10月5日,腾讯混元图像3.0在LMArena竞技场最新文生图榜单中超越谷歌Nano Banana、字节Seedream等26个全球主流模型登顶。这是中国首个登顶该权威榜单的开源模型,其80B参数量创下开源生图模型新纪录,并采用业界首创的工业级原生多模态架构。

LMArena由加州大学伯克利分校运营,采用人类偏好盲测机制,被视为最权威的AI模型用户体验评测平台。混元图像3.0在人工评测(GSB)中相较Nano Banana取得2.64%胜率优势,在语义对齐评测(SSAE)中多项指标超越闭源竞品。

💡 核心要点

  • 参数规模突破:80B参数总量,当前最大开源生图模型
  • 架构创新:首个工业级原生多模态架构,统一处理文本/图像/视频/音频
  • 评测表现:LMArena盲测胜率超Nano Banana 2.64%,SSAE指标达闭源水平
  • 技术突破:广义因果注意力机制+二维位置编码,实现多模态联合建模
  • 数据规模:基于50亿精选图文/视频数据+6T语料训练

📌 情报分析

技术价值:极高
原生多模态架构突破传统DiT局限,广义因果注意力机制实现文本自回归与图像全局注意力的统一建模。80B参数量+三阶段数据过滤流程构建技术壁垒。

商业价值:高
开源策略可快速建立生态,但工业级应用仍需验证。多模态能力潜在应用场景覆盖广告设计(香水广告案例)、教育(方程解题可视化)等泛娱乐与生产力领域。

趋势预测:高
标志开源模型首次在核心指标上超越闭源产品,可能加速行业开源进程。其自动分辨率预测功能预示AI生图向智能化工作流演进。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索