金吾财讯 | 英伟达(NVDA)推出超长上下文推理芯片Rubin CPX。Rubin CPX 和相关的 Vera Rubin NVL144 CPX 平台将于2026年底推出,将显着提高复杂软件编码和产生视讯应用程式的效能,这些应用程式可以接收多达100万个词元(Token)或更多的用户输入。
英伟达CEO黄仁勋表示,Rubin CPX 是首款专为百万级词元处理而建造的 CUDA GPU,是首款专为大规模上下文 AI 而构建的 CUDA GPU,模型可以同时进行数百万个知识词元的推理。
这款芯片系统在技术规格上实现重大突破。Rubin CPX GPU 提供30千万亿次浮点(flops)运算能力(NVFP4精度),配备 128GB GDDR7 内存,并整合硬件视讯解码和编码功能。完整的 Vera Rubin NVL144 CPX 平台在单一机架中整合144个 Rubin CPX GPU、144个 Rubin GPU 和36个 Vera CPU,提供 8 Exaflops AI 效能,比 GB300 NVL72 系统高出7.5倍。