tradingkey.logo

中國DeepSeek發布新版R1推理模型,稱能對標OpenAI、谷歌的頂尖模型

路透社2025年5月29日 13:14

- 中國人工智能初創公司--DeepSeek周四發布了R1推理模型的更新版本,加強了與OpenAI等美國同業的競爭。公司聲稱新版R1模型強化了深度思考能力,並能夠對標OpenAI和谷歌GOOGL.O推出的一些頂尖模型。

DeepSeek當日凌晨在開發者平台Hugging Face上發布了版本號“ DeepSeek-R1-0528”的新版R1推理模型,但並未在第一時間公布該模型的升級內容。

DeepSeek當日晚間在微信公眾號發文,披露了該模型的更多細節。該公司表示,新版R1仍然使用去年12月發布的DeepSeek V3 Base模型作為基座,在後訓練過程中投入了更多算力,顯著提升了思維深度與推理能力。

DeepSeek宣稱,更新後的R1模型在數學、編程與通用邏輯等多個基準測評中取得了當前國內所有模型中首屈一指的優異成績,並且在整體表現上已接近其他國際頂尖模型,如OpenAI的o3,與谷歌的Gemini-2.5-Pro。

此外,新版R1針對“幻覺”問題進行了優化。與舊版相比,更新後的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低45-50%左右,能夠有效地提供更為準確、可靠的結果。

其他方面的提升包括更貼近人類偏好的創意寫作,以及更好的前端代碼生成、角色扮演能力。

DeepSeek繼續開源了新版R1的模型,並允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

首版R1於1月份發布,導致中國以外的科技股在1月份暴跌,並"擴大人工智能規模需要龐大的計算能力和投資 "這一觀點提出了挑戰。自 R1 發布以來,阿里巴巴 9988.HK 和騰訊 0700.HK 等中國科技巨頭都發布了聲稱超過DeepSeek的模型。

人們仍普遍預計DeepSeek將發布R1的後續產品R2。路透3月份援引消息人士的話報導稱,R2最初計劃於5月份發布。DeepSeek還在3月份發布V3大型語言模型的升級版。(完)

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。
Tradingkey

相關文章

KeyAI