阿里通义千问发布全球最强开源代码大模型Qwen3-Coder-480B,性能超越Claude Sonnet-4

🎯 情报来源:AI News | VentureBeat

阿里巴巴旗下Qwen团队发布新一代开源代码大模型Qwen3-Coder-480B-A35B-Instruct,该模型以4800亿总参数、350亿激活参数的MoE架构,在SWE-bench评测中以69.6%的准确率超越Claude Sonnet-4(70.4%)和GPT-4.1(54.6%),成为当前性能最强的开源代码生成模型。模型支持256K原生上下文长度,通过YaRN技术可扩展至100万tokens,能够完整处理代码仓库级项目。

采用Apache 2.0开源协议,企业可免费商用。通过阿里云API调用成本低至1美元/百万tokens(输入),同时支持Hugging Face等平台部署。训练采用7.5万亿token数据集(70%代码数据),结合代码强化学习和长周期智能体训练等先进技术。

💡 核心要点

  • 性能标杆:SWE-bench 500轮评测69.6%准确率,优于GPT-4.1(54.6%)
  • 架构突破:480B参数MoE模型,35B/query激活,8/160专家激活
  • 成本优势:API调用成本1美元/百万tokens,仅为闭源模型1/5
  • 上下文扩展:原生256K tokens,通过YaRN支持100万tokens超长上下文
  • 工具生态:集成Claude Code/Ollama等12个开发平台,支持函数调用

📌 情报分析

技术价值:极高
MoE架构实现参数效率与性能平衡,YaRN技术突破上下文限制,代码RL训练方法在SWE-bench上验证有效性

商业价值:高
开源协议降低企业采用门槛,阿里云API价格体系形成差异化竞争优势,但开源生态建设仍需时间验证

趋势预测:高
代码大模型专业化趋势明显,结合第三方评测和开发者反馈,该模型或加速企业级DevOps工作流程智能化进程

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索