月之暗面发布Kimi-K2-Instruct-0905大模型:上下文窗口翻倍至25.6万token,万亿参数架构再升级

🎯 情报来源:Simon Willison's Weblog

中国AI公司月之暗面(Moonshot AI)于9月5日推出Kimi-K2-Instruct-0905大模型,这是继7月发布的Kimi-K2后的迭代版本。该模型采用混合专家架构,总参数量达1万亿,激活参数320亿,每个token选择8个专家,专家总数384个。

最显著升级在于上下文窗口从12.8万token扩展至25.6万token,实现翻倍增长。官方宣称在公开基准测试和实际编码代理任务中均表现出显著性能提升,多个主流编程基准得分较前代提高。

💡 核心要点

  • 上下文窗口:从12.8万→25.6万token(+100%)
  • 模型架构:1万亿参数MoE设计,384专家/32B激活参数
  • 性能提升:编程基准测试得分全面超越前代Kimi-K2
  • 定位:非严格MIT许可证的增量升级版本(社区称Kimi K-2.1)

📌 情报分析

技术价值:高
25.6万token上下文窗口现处行业第一梯队,万亿参数MoE架构体现工程突破,但具体基准测试数据未完全披露

商业价值:极高
编程场景性能强化直接对标开发者市场,256k上下文可支撑复杂代码库分析,潜在企业客户付费意愿明确

趋势预测:高
中国大模型竞赛进入「长上下文」+「垂直场景」双赛道,月之暗面持续加码技术代差,但需警惕开源生态竞争

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索