輝達(NVDA)宣布未來五年將投入 260 億美元研發開源 AI 大模型,展現從晶片製造商轉型為 AI 實驗室的戰略。此舉旨在挑戰 OpenAI 等模型領域領頭羊。該投資將覆蓋全產業鏈,預計 2026 年底至 2027 年初推出首批模型。輝達將採取「開放權重」模式,允許用戶免費下載模型運行與微調,同時保護訓練數據與底層代碼。新發布的 Nemotron 3 Super 模型專為企業級多智能體系統設計,具備 1200 億參數及 100 萬 Token 上下文窗口。此戰略預期鞏固輝達在 AI 生態中的核心地位,並可能每年額外貢獻 500 億美元營收。

TradingKey - 當地時間 3 月 12 日,輝達(NVDA)向美國 SEC 提交的財務文件引爆全球科技圈,這家全球 AI 晶片市佔率超 80% 的行業巨頭,宣布未來五年將累計投入 260 億美元佈局開源 AI 大模型研發,這一規模是 OpenAI 訓練 GPT-4 成本的 8 倍有餘。
伴隨著這筆史無前例的投資,輝達正式開啟從「晶片製造商」向「全疊式 AI 頂尖實驗室」的戰略轉型,直接向 OpenAI、DeepSeek 等模型領域頭部玩家發起挑戰。
不同於單一模型的研發投入,輝達的 260 億美元將覆蓋開源 AI 大模型全產業鏈,資金將在未來 18 至 24 個月內逐步落地,首批自研開源 AI 模型最快將於 2026 年底至 2027 年初正式面市。
目前,輝達已完成技術驗證,一個擁有 5500 億參數的超大模型預訓練工作已秘密完成,為後續開源模型研發積累了關鍵技術經驗。按照規劃,輝達將重點研發覆蓋語言、代碼、科學計算、智能體等多領域的多模態前沿大模型,構建完善的模型矩陣。
在技術路線選擇上,輝達避開了 OpenAI 的完全閉源模式與 Meta Llama 系列的完全開源模式,轉而採用「開放權重」的中間道路。
公開模型關鍵參數(權重),允許企業和開發者免費下載,在自有設備或私有雲上運行、微調,充分滿足企業對數據隱私、定制化和成本控制的核心需求;但模型的訓練數據和底層代碼則可能保持非公開狀態。
這種模式精準切中了當前市場痛點,OpenAI、Anthropic 等美國頭部企業的核心模型均採用閉源模式,僅提供雲端訪問;Meta 也暗示未來可能收緊開源策略;而中國企業 DeepSeek、阿里巴巴等憑藉免費開源策略已吸引大量全球開發者。
輝達的「開放權重」模型既兼顧了企業級用戶的隱私需求,又通過開放生態綁定開發者群體。
與巨額投資計劃同步,輝達近日推出新一代開源大語言模型 Nemotron 3 Super。這款專為企業級多智能體系統設計的模型擁有 1200 億總參數,採用高效混合專家(MoE)架構,原生支持 100 萬 Token 超長上下文窗口,可一次性處理整部小說或數千頁財務報告,有效解決了多智能體工作流中「上下文爆炸」和「目標漂移」的行業難題。
在性能測試中,Nemotron 3 Super 表現亮眼,在人工智能指數綜合評分中獲得 37 分,超過 OpenAI 開源模型 GPT-OSS 的 33 分;在專門評估 OpenClaw 控制能力的 PinchBench 測試中位列第一。
輝達應用深度學習研究副總裁 Bryan Catanzaro 透露,公司正在開源模型開發領域取得大量進展,近期還完成了 5500 億參數模型的預訓練。
長期以來,輝達在 AI 晶片領域佔據絕對主導地位,但 AI 模型層的話語權卻被 OpenAI、Meta(META)等廠商掌握。
此次輝達下場自研頂級開源模型,核心戰略意圖是從底層定義 AI 模型技術路線,讓自家的硬體架構、軟體棧成為整個 AI 行業的事實標準。
輝達企業生成式 AI 軟體副總裁 Kari Briski 表示,開發前沿模型不僅是為了測試算力,更是通過對儲存、網路及超算級數據中心的極限壓力測試,為下一代硬體架構發展路線圖指明方向。這種「硬體-模型」雙輪驅動的戰略,將進一步鞏固輝達在 AI 生態中的核心地位。
金融分析師普遍看好輝達的戰略轉型,認為這將為公司打開新的增長曲線。如果輝達在鞏固硬體霸主地位的同時,能在基礎模型市場拿下 10% 的份額,三年內有望每年額外貢獻 500 億美元營收。
對於輝達而言,這場 260 億美元的豪賭,既是對自身技術實力的自信,也是對 AI 行業未來趨勢的精準研判。當晶片巨頭開始定義 AI 模型標準,全球 AI 產業的格局或將迎來新一輪洗牌。