Kimi K2开源1T参数MoE大模型,128K上下文+32B激活参数创多项SOTA

🎯 情报来源:量子位

2025年7月12日凌晨,月之暗面(Kimi)发布全新K2基础大模型,以1T总参数、32B激活参数的MoE架构刷新开源领域多项基准记录。该模型在SWE Bench Verified等测试中表现突出,重点强化代码生成(支持3D场景构建)、Agent工具调用(复杂指令自动拆解)及数学推理能力,并同步开放Web/App/API全渠道服务。

官方公布技术细节显示,K2通过创新MuonClip优化器完成15.5T token无异常训练,采用大规模Agentic Tool Use数据合成管道覆盖数千工具场景。其开源策略采用修改版MIT协议,仅对月活超1亿或月收入2000万美元以上产品附加署名要求。

💡 核心要点

  • 参数规模:1T总参数MoE架构,32B激活参数,128K上下文窗口
  • 性能突破:SWE Bench Verified等6项基准测试开源SOTA
  • 商用条款:修改版MIT协议,亿级商业化需标注模型来源
  • 训练数据:15.5T token无异常训练,创新MuonClip优化器
  • 生态布局:同步上线Web/App/API,开源基础版与指令微调版

📌 情报分析

技术价值:极高
• 万亿参数规模下实现32B激活参数的高效推理,MuonClip优化器解决大模型训练稳定性问题,15.5T token训练数据量达行业第一梯队

商业价值:高
• 开源策略直接挑战DeepSeek生态位,修改协议保留品牌曝光权益;Agent工具链覆盖数百领域,但需验证实际商业场景落地能力(如Demo中演唱会规划存在场次过时问题)

趋势预测:高
• 标志国产大模型竞争进入「开源+垂直能力」新阶段,Kimi通过代码/Agent专项优势构建差异化壁垒,但需应对腾讯等巨头依托开源模型的快速追赶

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索