通义千问Qwen3-VL-235B重磅开源:性能对标Gemini 2.5 Pro,参数规模达2350亿

🎯 情报来源:Simon Willison's Weblog

阿里巴巴旗下通义千问团队今日正式开源其多模态大模型旗舰产品Qwen3-VL-235B系列,包含Instruct和Thinking两个版本。其中Instruct版本在主要视觉感知基准测试中达到或超越谷歌Gemini 2.5 Pro水平,Thinking版本则在多模态推理任务中取得当前最优成绩。

该模型参数规模达2350亿,Hugging Face发布的模型文件体积达471GB,远超前代Qwen 2.5 VL系列最大72B参数的版本。团队同步推出三款闭源API模型:升级版Qwen 3 Coder、实时多模态翻译模型Qwen3-LiveTranslate-Flash,以及万亿参数旗舰模型Qwen3-Max。

💡 核心要点

  • 2350亿参数:开源模型规模较前代最大版本提升3.2倍
  • 超越Gemini 2.5 Pro:Instruct版本在视觉感知基准实现对标/超越
  • 471GB模型体积:单个模型文件超过常规消费级设备运存极限
  • 万亿参数闭源模型:Qwen3-Max成为团队迄今最大规模产品
  • 实时翻译API:新增Qwen3-LiveTranslate-Flash商业应用场景

📌 情报分析

技术价值:极高
235B参数规模+多模态SOTA表现,确立开源视觉LLM新标杆;Thinking版本在复杂推理任务突破具有研究价值

商业价值:高
API产品线补充实时翻译等场景化方案,但开源模型过大可能限制实际部署,需等待轻量化版本

趋势预测:高
基于Qwen 2.5 VL的版本迭代速度(72B→235B),万亿参数时代竞争将加速;多模态模型轻量化将成为下阶段技术焦点

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索