金吾財訊 | 據外媒引述三位知情人士表示,中國人工智能公司DeepSeek因未能使用華爲晶片進行訓練,推遲其新模型的發佈。報道知情人士表示,DeepSeek在1月發佈R1模型後,被鼓勵採用華爲的升騰(Ascend)處理器,而非使用英偉達(NVDA)來進行AI模型訓練。在公司在使用升騰晶片訓練R2模型的過程中遇到技術問題,促使其改用輝達晶片進行訓練,並使用華爲晶片進行推理。知情人士向媒體表示,這些問題是模型從5月延遲發佈的主要原因。
請登入後使用 KeyAI