🎯 情报来源:Simon Willison's Weblog
通义千问(Qwen)于7月推出第六代模型Qwen3-Coder-30B-A3B-Instruct,这是专为编程任务优化的非通用模型。该模型总参数30.5B,运行时动态激活参数仅3.3B,经6bit量化后仅需24.82GB显存,可在64GB内存设备流畅运行,实测生成速度达60 token/s。
开发者通过LM Studio+Open WebUI组合实测显示,模型能一次性生成可运行的《太空侵略者》游戏代码,并支持工具调用等进阶功能。技术社区评价其实现了”编程性能、运行速度与设备兼容性”的三角平衡。
💡 核心要点
- 参数规模:30.5B总参数/3.3B动态激活参数
- 设备需求:6bit量化后24.82GB,支持64GB Mac本地运行
- 生成速度:实测SVG代码生成达60 token/s
- 编程能力:单次提示生成可运行《太空侵略者》游戏代码
- 工具调用:成功执行时间查询、版本检测等基础工具调用
📌 情报分析
技术价值(高):动态参数激活技术显著降低硬件门槛,6bit量化后仍保持60token/s生成速度,在专用模型领域实现技术突破。
商业价值(一般):聚焦开发者细分场景,但30B级模型面临Stable Code等竞品直接竞争,商业化路径尚待验证。
趋势预测(高):2024下半年将出现更多”高参数低显存”的垂直领域模型,Qwen的量化方案可能成为行业参考标准。