🎯 情报来源:量子位
在AI Infra Summit上,英伟达宣布推出专为处理百万token级别的代码生成和生成式视频应用的全新GPU——NVIDIA Rubin CPX。该GPU基于NVIDIA Rubin架构,采用单片设计,内置NVFP4计算资源,主打AI推理的高性能和高能效。老黄表示,Rubin CPX是首款为超大上下文AI量身定制的CUDA GPU,可以让模型“一口气”推理数百万token。
此外,Rubin CPX在NVFP4精度下可提供高达30PFLOPS算力,配备128GB高性价比GDDR7内存,与NVIDIA GB300 NVL72系统相比,注意力机制处理速度提升3倍。预计将于2026年底正式推出。
💡 核心要点
- 首款专为超大上下文AI设计的CUDA GPU,支持百万级token处理
- NVFP4精度下算力高达30PFLOPS,配备128GB GDDR7内存
- 与NVIDIA GB300 NVL72系统相比,注意力机制处理速度提升3倍
- 每投资1亿美元,可获得50亿美元的token收益
- 预计2026年底正式推出
📌 情报分析
技术价值:极高 – Rubin CPX在算力和内存方面的显著提升,使其在处理超大上下文任务时具有明显优势,尤其是30PFLOPS算力和128GB内存的配置。
商业价值:高 – 每投资1亿美元可获得50亿美元的token收益,显示出极高的ROI潜力,吸引了Cursor、Runway、Magic等行业大佬的关注。
趋势预测:高 – 随着AI模型对长上下文处理需求的增加,Rubin CPX有望成为未来AI推理的主流硬件选择,尤其是在代码生成和生成式视频领域。