tradingkey.logo

雙雄圍堵,能否突破英偉達算力壟斷?

財華社2025年12月3日 03:35

12月2日,亞馬遜(AMZN.US)在AWS re:Invent 2025大會上,發佈新一代芯片Trainium 3和搭載Trainium 3,並透露正研發可兼容英偉達(NVDA.US)芯片的下一代產品Trainium 4。

據亞馬遜介紹,第三代芯片與繫統在AI訓練和推理性能上實現了顯著飛躍:UltraServer繫統速度提升超4倍,内存容量擴大4倍,不僅能加速訓練,還能滿足峰值需求下的AI應用部署。單台服務器可搭載144枚芯片,更支持數千台服務器互聯構成百萬芯片集群——規模為上一代的10倍。

值得留意的是,新一代芯片能效比提升40%。在全球數據中心耗電量激增的背景下,AWS正著力打造更節能的繫統。這既符合企業自身利益,也可為雲端AI客戶節約開支。科技巨頭們越來越認識到,AI芯片最終的決勝戰場,將在於能效比,這是其下遊客戶決定是否大規模部署的關鍵,因為這決定了往後的運營成本與盈利能力。

亞馬遜也透露,其參投的Anthropic、日本大模型公司Karakuri、SplashMusic、基因編輯公司Metagenomi、理光(Ricoh)等客戶已採用第三代繫統,訓練和推理成本降低一半。

與谷歌圍堵英偉達

儘管亞馬遜AWS佔據最大的雲市場份額,但正面臨微軟(MSFT.US)和谷歌(GOOG.US)的激烈競爭,驅動AI應用的大語言模型需要巨大算力進行訓練和運行,這為雲計算廠商創造了廣闊的市場空間。谷歌近期發佈的Gemini 3模型引發市場熱切關注,有意思的是,谷歌近來改變策略,將原本自用的内部芯片TPU用於對外發售,最新推出的訓練、推理和服務優化第七代TPU芯片鐵木(Ironwood)無論性能還是能效都頗具競爭力,已成為OpenAI等客戶與英偉達就AI芯片價格談判的籌碼,另外Anthropic已與其達成數百億美元合作,部署百萬個TPU芯片,上週更有報道稱Meta(META.US)考慮採用谷歌的這款芯片。

從行業邏輯來看,亞馬遜與谷歌的芯片突破,本質上是雲計算巨頭「算力自主化」戰略的必然結果。驅動AI應用的大語言模型對算力的海量需求,正倒逼雲廠商構建自研算力體繫以擺脫對英偉達的依賴。對於亞馬遜而言,自研芯片既能降低自身算力採購成本,又能通過差異化的算力服務鞏固雲市場優勢;谷歌則憑借TPU與Gemini 3模型的深度耦合,形成「芯片-模型-雲服務」的全棧閉環,其全棧垂直整合能力或對英偉達的「軟硬一體」模式構成直接挑戰。​

不過,英偉達的算力霸權短期内仍難以被徹底撼動。其核心優勢不僅在於GPU硬件的性能領先,更在於CUDA平台積累的兩千萬開發者社群與超10萬個適配應用,客戶的生態遷移成本高達數千萬美元,這一深厚的軟件護城河是亞馬遜Trainium與谷歌TPU短期内難以逾越的壁壘。英偉達也在公開回應中強調,自身是唯一能運行所有AI模型、並在所有計算場景中部署的平台,其領先行業一代的技術優勢仍不可小觑。​

或許正是深刻意識到生態壁壘的堅固,亞馬遜展現出了務實的「競合」智慧,同時透露了Trainium 4路線圖,預計性能將至少達到第3代產品的三倍,將可支持英偉達NVLink Fusion高速互聯技術,這意味著搭載Trainium4的AWS繫統既能與英偉達GPU協同工作,又可繼續使用亞馬遜自研的低成本服務器架技術。考慮到英偉達CUDA已成為AI應用的事實標準,Trainium4繫統或將吸引更多基於英偉達GPU開發的大型AI應用遷移至亞馬遜雲平台。目前官方未公佈Trainium4具體時間表。

結語

可以預見的是,未來的AI芯片市場將從英偉達「一家獨大」的格局,轉向「通用GPU+專用ASIC」的異構部署新階段。亞馬遜Trainium繫列的能效優勢與生態兼容能力,疊加谷歌TPU的商業化突破,將持續分流英偉達的市場份額,而客戶也將傾向於多路線並行的算力採購策略以分散風險。這場算力爭奪戰的最終走向,不僅取決於硬件性能與能效的比拼,更在於生態壁壘的突破與重構,而這一過程,也將深刻重塑整個 AI 基礎設施產業的競爭邏輯。

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。

相關文章

KeyAI