tradingkey.logo

DeepSeek的R1-0528現在落後於Openai的O4-Mini

Cryptopolitan2025年5月30日 10:30

DeepSeek已推出R1-0528,這是對中國初創企業R1推理模型的重大升級,該模型於一月份發佈。在阿里巴巴集團Holding的Qwen3擊敗了LiveBench的原始DeepSeek R1之後,升級僅一個月纔到達,這是開源人造模型的在線基準。

DeepSeek升級的R1-0528型號現在與OpenAI和Google Performance的領先AI模型一起站立。復出表明,中國大型技術公司和新技術公司正在推動改善AI工具的速度。

DeepSeek在聲明中說,R1-0528表現出更好的推理和創造性的寫作技巧。該更新還具有StronGER編碼能力。最重要的是,該公司聲稱該模型現在產生的“幻覺”減少了50%。

DeepSeek解釋說,這些升級來自在訓練後培訓階段投入的額外計算能力,當時工程師在主要培訓過程後對模型進行了微調。在訓練後階段,工程師旨在提高模型的效率並提高其準確性和安全性。

R1-0528現在落後於Openai的O3和O4-Mini

在測量AI模型性能的LiveCodeBench上, R1-0528現在僅落後於OpenAI的O4-Mini和O3型號。

Hugging Face的AI研究人員Adina Yakefu說:“ DeepSeek的最新升級是推理,tronGER的數學和代碼方面的更加清晰,並關閉了Gemini和O3等頂級模型。”

她補充說,新版本顯示了“推理和減少幻覺的重大改進”,並證明這家初創企業不僅在趕上,而且在積極競爭中。

在華盛頓將高級籌碼和其他技術出口限制爲中國之後,進步迅速。然而,中國公司繼續完善其系統。本月初,Baidu和Tencent描述了他們使模型運行效率更高的方式,儘管訪問了尖端的半導體。

NVIDIA首席執行官詹森·黃(Jensen Huang)週三批評出口控制。他說:“美國基於中國不能製造AI芯片的假設。” “這個假設總是值得懷疑的,現在顯然是錯誤的。問題不是中國是否會有AI。它已經做到了。”

DeepSeek將阿里巴巴的Qwen3 8b型號的性能提高了10%

DeepSeek還表示,它將R1-0528中使用的推理步驟提煉爲阿里巴巴的Qwen3 8b基本型號。據該公司稱,該過程創造了一種新的,較小的模型,該模型超過了Qwen3的性能超過10%。同時,該型號小於30倍。

該公司表示:“我們認爲,DeepSeek-R1-0528的思想鏈對於在小型模型上的推理模型和工業工作中的學術研究將非常重要。”

路透社報道,一位Deepseek代表告訴一個微信集團,這一變化是“次要審判升級”,已經開放了公共測試。爲了響應激烈的競爭,Google折扣了一些雙子座訪問層,而OpenAI則引入了低成本的O3 Mini型號。

密碼大都會學院:厭倦了市場波動?瞭解DeFi幫助您建立穩定的被動收入。立即註冊

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。
Tradingkey

相關文章

KeyAI