Qwen3-Coder-30B-A3B发布:30.5B参数编程专用模型,60 token/s速度可本地运行

🎯 情报来源:Simon Willison's Weblog

通义千问(Qwen)于7月推出第六代模型Qwen3-Coder-30B-A3B-Instruct,这是专为编程任务优化的非通用模型。该模型总参数30.5B,运行时动态激活参数仅3.3B,经6bit量化后仅需24.82GB显存,可在64GB内存设备流畅运行,实测生成速度达60 token/s。

开发者通过LM Studio+Open WebUI组合实测显示,模型能一次性生成可运行的《太空侵略者》游戏代码,并支持工具调用等进阶功能。技术社区评价其实现了”编程性能、运行速度与设备兼容性”的三角平衡。

💡 核心要点

  • 参数规模:30.5B总参数/3.3B动态激活参数
  • 设备需求:6bit量化后24.82GB,支持64GB Mac本地运行
  • 生成速度:实测SVG代码生成达60 token/s
  • 编程能力:单次提示生成可运行《太空侵略者》游戏代码
  • 工具调用:成功执行时间查询、版本检测等基础工具调用

📌 情报分析

技术价值(高):动态参数激活技术显著降低硬件门槛,6bit量化后仍保持60token/s生成速度,在专用模型领域实现技术突破。

商业价值(一般):聚焦开发者细分场景,但30B级模型面临Stable Code等竞品直接竞争,商业化路径尚待验证。

趋势预测(高):2024下半年将出现更多”高参数低显存”的垂直领域模型,Qwen的量化方案可能成为行业参考标准。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索