英伟达发布Rubin CPX GPU:专为百万级token处理设计,性能提升3倍,2026年上市

🎯 情报来源:量子位

在AI Infra Summit上,英伟达宣布推出专为处理百万token级别的代码生成和生成式视频应用的全新GPU——NVIDIA Rubin CPX。该GPU基于NVIDIA Rubin架构,采用单片设计,内置NVFP4计算资源,主打AI推理的高性能和高能效。老黄表示,Rubin CPX是首款为超大上下文AI量身定制的CUDA GPU,可以让模型“一口气”推理数百万token。

此外,Rubin CPX在NVFP4精度下可提供高达30PFLOPS算力,配备128GB高性价比GDDR7内存,与NVIDIA GB300 NVL72系统相比,注意力机制处理速度提升3倍。预计将于2026年底正式推出。

💡 核心要点

  • 首款专为超大上下文AI设计的CUDA GPU,支持百万级token处理
  • NVFP4精度下算力高达30PFLOPS,配备128GB GDDR7内存
  • 与NVIDIA GB300 NVL72系统相比,注意力机制处理速度提升3倍
  • 每投资1亿美元,可获得50亿美元的token收益
  • 预计2026年底正式推出

📌 情报分析

技术价值:极高 – Rubin CPX在算力和内存方面的显著提升,使其在处理超大上下文任务时具有明显优势,尤其是30PFLOPS算力和128GB内存的配置。

商业价值:高 – 每投资1亿美元可获得50亿美元的token收益,显示出极高的ROI潜力,吸引了Cursor、Runway、Magic等行业大佬的关注。

趋势预测:高 – 随着AI模型对长上下文处理需求的增加,Rubin CPX有望成为未来AI推理的主流硬件选择,尤其是在代码生成和生成式视频领域。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索