商汤联合DeepLink发布异构混合调度方案,大模型训练效率达单一芯片集群90%

🎯 情报来源:量子位

在2025世界人工智能大会(WAIC)期间,商汤大装置发布基于DeepLink的异构混合调度方案,旨在解决国产算力资源碎片化、异构芯片调度复杂等行业挑战。该方案通过深度融入DeepLink技术,提升异构集群的协同效率与运行可靠性,加速国产AI算力从“可用”迈向“好用”。

上海AI实验室联合商汤等合作伙伴,已在千亿量级参数的自研模型上完成20天不间断长稳训练,效率达单一芯片集群的90%。这一突破为超大模型混训提供了可行的技术保障,商汤大装置在此过程中提供了算力调度和管理平台。

💡 核心要点

  • 效率提升:异构混合调度方案使训练效率达单一芯片集群的90%
  • 稳定性:支持20天不间断长稳训练,故障恢复时间缩短至分钟级
  • 兼容性:适配DeepSeek、InternLM、LLaMA、Qwen等主流大模型
  • 合作规模:上海AI实验室联合商汤等十余家合作伙伴建成超大规模跨域混训集群
  • 技术突破:实现多芯片协同调度与负载均衡,打破芯片架构差异壁垒

📌 情报分析

技术价值:极高
方案通过训练加速、异构通信、并行策略等核心技术,显著提升异构集群的计算潜力,技术突破明显。

商业价值:高
方案支持主流大模型全流程运行,适配多种芯片架构,商业化落地潜力大,但需进一步验证大规模应用效果。

趋势预测:高
随着国产AI算力需求增长,异构混合调度技术将成为行业标配,商汤与DeepLink的合作有望引领这一趋势。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索