金吾財訊 | 英偉達(NVDA)推出超長上下文推理芯片Rubin CPX。Rubin CPX 和相關的 Vera Rubin NVL144 CPX 平臺將於2026年底推出,將顯着提高複雜軟件編碼和產生視訊應用程式的效能,這些應用程式可以接收多達100萬個詞元(Token)或更多的用戶輸入。
英偉達CEO黃仁勳表示,Rubin CPX 是首款專爲百萬級詞元處理而建造的 CUDA GPU,是首款專爲大規模上下文 AI 而構建的 CUDA GPU,模型可以同時進行數百萬個知識詞元的推理。
這款芯片系統在技術規格上實現重大突破。Rubin CPX GPU 提供30千萬億次浮點(flops)運算能力(NVFP4精度),配備 128GB GDDR7 內存,並整合硬件視訊解碼和編碼功能。完整的 Vera Rubin NVL144 CPX 平臺在單一機架中整合144個 Rubin CPX GPU、144個 Rubin GPU 和36個 Vera CPU,提供 8 Exaflops AI 效能,比 GB300 NVL72 系統高出7.5倍。