🎯 情报来源:AI News | VentureBeat
阿里巴巴旗下Qwen团队发布新一代开源代码大模型Qwen3-Coder-480B-A35B-Instruct,该模型以4800亿总参数、350亿激活参数的MoE架构,在SWE-bench评测中以69.6%的准确率超越Claude Sonnet-4(70.4%)和GPT-4.1(54.6%),成为当前性能最强的开源代码生成模型。模型支持256K原生上下文长度,通过YaRN技术可扩展至100万tokens,能够完整处理代码仓库级项目。
采用Apache 2.0开源协议,企业可免费商用。通过阿里云API调用成本低至1美元/百万tokens(输入),同时支持Hugging Face等平台部署。训练采用7.5万亿token数据集(70%代码数据),结合代码强化学习和长周期智能体训练等先进技术。
💡 核心要点
- 性能标杆:SWE-bench 500轮评测69.6%准确率,优于GPT-4.1(54.6%)
- 架构突破:480B参数MoE模型,35B/query激活,8/160专家激活
- 成本优势:API调用成本1美元/百万tokens,仅为闭源模型1/5
- 上下文扩展:原生256K tokens,通过YaRN支持100万tokens超长上下文
- 工具生态:集成Claude Code/Ollama等12个开发平台,支持函数调用
📌 情报分析
技术价值:极高
MoE架构实现参数效率与性能平衡,YaRN技术突破上下文限制,代码RL训练方法在SWE-bench上验证有效性
商业价值:高
开源协议降低企业采用门槛,阿里云API价格体系形成差异化竞争优势,但开源生态建设仍需时间验证
趋势预测:高
代码大模型专业化趋势明显,结合第三方评测和开发者反馈,该模型或加速企业级DevOps工作流程智能化进程
