4 月 4 日消息,據美國科技媒體 The Information 最新報道,中國 AI 初創公司 DeepSeek 即將發佈的新一代旗艦模型 V4,將完全運行於華爲自研芯片之上,被視爲中國推動半導體自主化進程的重要里程碑。 V4 預計將在未來數週內發佈,並將完全運行於華爲芯片。DeepSeek 爲此與華爲及芯片設計商寒武紀合作數月,重新改寫了模型底層部分代碼,以實現與國產芯片的兼容。 值得注意的是,DeepSeek 這次並未向英偉達開放 V4 的提前測試權限,僅邀請國內芯片企業參與早期優化,打破了業界慣例。 阿里巴巴、字節跳動、騰訊等中國科技巨頭已提前採購華爲最新款 Ascend 950PR 芯片,總訂單量達數十萬顆,計劃通過雲服務部署 V4 並整合至自家 AI 應用。需求激增推動該芯片價格上漲約 20%。 V4 採用混合專家架構(MoE),總參數量約 1 萬億,每次推理激活約 370 億參數,可在保持低延遲的同時支持文本、圖像與代碼的多模態輸入。 去年 DeepSeek 發佈低成本模型 V3 和 R1,曾引發全球科技股大跌,令市場質疑美國 AI 公司是否需要耗資數十億美元採購算力。V4 因此備受國際關注。