OpenAI与NVIDIA联合发布GPT-OSS开源模型,Blackwell平台推理性能达150万token/秒

🎯 情报来源:NVIDIA Blog

OpenAI与NVIDIA今日联合发布两款开源权重AI推理模型GPT-OSS-120B和GPT-OSS-20B,标志着顶尖AI技术正式向全球开发者、企业及政府机构开放。这两款基于NVIDIA H100 GPU训练的大语言模型,在Blackwell平台优化后实现每秒150万token的推理速度,可部署于全球4.5亿CUDA设备构成的算力网络。

NVIDIA创始人黄仁勋强调,此次合作将强化美国在AI领域的技术领导地位。模型已针对FlashInfer、Hugging Face等主流开源框架优化,覆盖医疗、制造等行业的生成式AI应用场景,并支持实时部署万亿参数级LLM。

💡 核心要点

  • 性能突破: NVIDIA GB200 NVL72系统实现1.5M tokens/秒推理速度
  • 生态规模: 可部署于全球4.5亿CUDA设备,覆盖250国650万开发者
  • 技术特性: 采用NVFP4 4位精度技术,功耗降低30%以上
  • 商业价值: 实时万亿参数LLM部署能力可释放数十亿美元行业价值
  • 历史合作: 自2016年首次交付DGX-1超算以来持续深度协同

📌 情报分析

技术价值:极高
Blackwell架构的NVFP4精度技术突破显著提升能效比,150万token/秒的推理速度树立行业新标杆。开源权重设计降低技术准入门槛。

商业价值:高
覆盖全球90%AI开发设备的部署能力,结合医疗/制造等垂直场景优化,预计3年内带动超50亿美元企业AI应用投资。

趋势预测:极高
开源模型+专用AI工厂模式将加速产业AI化进程,2025年前或催生30%新增AI用例。NVIDIA算力生态护城河持续加深。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索