
金吾財訊 | 國泰海通發研報指,2026 CES開幕,英偉達、英特爾、AMD等北美頭部算力廠商密集更新新產品進展。
新硬件、新架構、開源全家桶,英偉達展示全面的AI基礎設施部署與迭代,強調物理AI的應用前景。英偉達宣佈新一代AI平臺Rubin已進入全面量產階段,Rubin包含六款新型芯片:Vera CPU、Rubin GPU、NVLink 6交換機、ConnectX-9超級網卡、BlueField-4 DPU及Spectrum-6以太網交換機。其中,Rubin GPU在訓練任務的運行速度是Blackwell架構的3.5倍,在推理任務的速度達到了Blackwell的5倍,峯值運算能力達50 Petaflops。1)計算效率方面,相較於Blackwell平臺,Rubin推理階段的token成本最高降低10倍,並將訓練混合專家模型(MoE)所需的GPU數量減少至原來的1/4。2)架構創新方面,針對推理過程中產生的大量KV Cache問題,英偉達推出由BlueField-4驅動的推理上下文內存存儲平臺,在GPU內存和傳統存儲之間創建一個第三層,通過擴大上下文容量、加快跨節點共享,在特定場景下,每秒處理的token數提升最高達5倍,並實現同等水平的能效優化。該推理上下文內存存儲平臺有助於幫助Agent保留長期記憶,長期運行、反覆思考。3)部署節奏方面,微軟和Coreweave將成爲2026下半年首批部署Rubin的客戶,微軟的下一代Fairwater AI超級工廠將配備Vera Rubin NVL72機架級系統,規模可擴展至數十萬顆Vera Rubin芯片。4)應用方面,黃仁勳表示物理AI的ChatGPT時刻快要到來。英偉達發佈了Alpamayo系列VLA開源AI模型和工具,用於自動駕駛車輛開發。英偉達DRIVE系統正式進入量產階段,首先應用於梅賽德斯-奔馳CLA,計劃2026年在美國上路。這款車將搭載L2++級自動駕駛系統,採用“端到端AI模型+傳統流水線”的混合架構。
AMD推出基於MI 455X的Helios機架。Helios機架採用全液冷設計,配備四個Instinct MI455X GPU和一個EPYC Venice Zen6 CPU。此外,MI500系列芯片也在開發中,將採用2nm工藝。隨着MI500系列在2027年推出,AMD有望在4年時間內將AI性能芯片提升1000倍。
英特爾推出首款基於18A製程節點打造的計算平臺。英特爾正式發佈了基於18A工藝的最新一代客戶端處理器英特爾酷睿Ultra 3系列(代號Panther Lake)。酷睿Ultra 3平臺的總AI算力達到180 TOPS,其中GPU貢獻了120TOPS,憑藉大內存支持,該平臺成爲業內首個能在本地運行700億參數大語言模型並支持32k上下文的客戶端芯片。首批搭載酷睿Ultra 3處理器的消費級筆記本電腦將於2026年1月6日開啓預售,並於2026年1月27日起在全球範圍內面市,更多產品設計將於2026上半年陸續推出。