tradingkey.logo

大模型狂奔,網絡掉隊?兩會熱議:AI算力的下一個瓶頸在“連接”

證券之星2026年3月10日 10:30

隨着2026年全國兩會召開,智能經濟成爲代表委員熱議的焦點。政府工作報告明確提出要“打造智能經濟新形態”,並將“實施超大規模智算集羣”列爲新型基礎設施建設重點方向。

毋庸置疑,這一戰略部署背後,隱含着對人工智能基礎設施更高層次的需求。在業界持續聚焦芯片算力提升的同時,一個更爲基礎性的技術瓶頸也浮出水面——網絡的承載能力。

當前,人工智能模型參數已進入萬億級規模,訓練任務從單卡向萬卡甚至十萬卡集羣演進,帶來的是對網絡通信能力的極限挑戰。大模型訓練要求在微秒級時間內完成海量參數同步,對網絡的延遲、丟包率和可擴展性提出了前所未有的要求:網絡延遲過高將直接導致算力閒置;數據丟包則可能導致訓練任務中斷,造成巨大的資源浪費。

騰訊光網絡架構師付思東指出,從2016年的Pascal架構到2024年的Blackwell架構,AI算力在八年內實現約1000倍增長,而網絡帶寬同期僅提升4倍。這種“算力如火箭攀升,網絡如步行前進”的失衡狀態,正在倒逼產業界重新審視網絡技術的戰略價值。

在此背景下,如何實現“以網強算”成爲產業界亟待破解的命題。

近期,NVIDIA發佈的2026財年報告爲業內提供了參考樣本。數據顯示,NVIDIA網絡業務迎來空前爆發——全年收入突破310億美元,相比2021財年收購邁絡思(Mellanox)時增長超10倍。單第四季度,網絡業務營收達110億美元,同比增長263%。

這一增長背後,是InfiniBand(IB)技術在超大規模AI集羣中的深度滲透。IB網絡以其獨特的基於信用的流控機制,可以在傳輸前確保接收端資源充足,從根本上杜絕擁塞與丟包,交換延遲低至100納秒,是目前高性能計算領域公認的標杆方案。

但對國產智算集羣來說,其核心技術由NVIDIA長期壟斷,供應鏈高度集中。在信創戰略持續推進下,國產IB仍然存在明顯的市場空白。

相較之下,RoCE方案試圖在通用以太網架構上實現IB類似的無損傳輸能力,成本優勢較強。然而,深入分析當前主流RoCE方案可知,儘管交換機品牌國產化進展不慢,但其核心交換芯片仍主要依賴博通(Broadcom),網卡芯片則由邁絡思(Mellanox)主導。

在200G及以上高速互聯領域,RoCE相關的I/O環節技術能力尚處於追趕階段(目前僅能支持100G級別),與IB網絡主流的400G方案存在代際差距,很難滿足大算力集羣互聯需求。

這也意味着,AIDC高端互聯領域核心技術仍未脫離海外廠商掌控,想要高位對接超大規模智算集羣需求,必須直面IB技術路線國產化難關。

“NV網絡業務爆發印證了一個基本事實:在超大規模智算集羣時代,高性能網絡已經拿到主角劇本”。有業內人士認爲,IB技術路線因其原生一體化設計和對極致性能的追求,成爲全球頭部AI集羣的高配選擇。

他指出,在國產智算基礎設施發展初期,RoCE不啻於一種務實方案,但在大集羣網絡互聯中,僅依靠嫁接於通用以太網的技術路徑,很難從根本上突破性能天花板。

因此,推動IB網絡自主化建設,已不僅僅是一項技術命題,更是AI大算力時代的戰略任務。其意義不侷限於現有國產技術體系的局部優化,而是真正錨定高性能網絡這一核心短板,建立起兼顧自主可控和高效可用的技術底座,打造真正具備國際競爭力的智能算力新基建。

兩會期間對超大規模智算集羣的政策引導,既是對人工智能產業發展的強力推動,也向產業鏈上下游遞出一份更嚴格的考卷。在AI算力競爭日益白熱化當下,網絡連接能力正成爲決定集羣效能的核心變量之一。打通智算集羣的“任督二脈”,亟需在覈心網絡技術上實現從外部依賴到自立自強的躍遷。這條路可能艱難且漫長,但卻是叩響AI時代大門的關鍵一步。

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。
Tradingkey

推薦文章

Tradingkey
KeyAI