tradingkey.logo

阿里巴巴的QWEN3取消了DeepSeek的R1,現在領導開源AI模型

Cryptopolitan2025年5月6日 16:55

阿里巴巴新的Qwen3 AI模型家族已經超過了DeepSeek的R1,成爲世界上最好的開源模型。據報道,在測量語言指導,數學,編碼和數據分析等領域的開源AI模型的測試中,QWEN3的表現要比R1更好。 

QWEN3家族上週由阿里巴巴的雲計算單元推出。它具有八個改進的模型,其中有6億至2350億個參數。在機器學習中,參數是AI系統正在訓練時的變量。

根據Indepen dentLiveBench在這些新測試之前,DeepSeek的R1一直是自一月份發佈以來世界上最好的開源AI模型。但不再了。

美國和中國公司都急於採用Qwen 3

Qwen3在LiveBench排名中的興起表明,AI在中國發展的速度。得益於開源工具,中國科技行業已經發展了很多。阿里巴巴開源方法代碼允許其他第三方軟件開發人員共享設計,修復損壞的鏈接或使程序更強大。 

但是,總體LiveBench結果表明,Qwen3不如Openai的O3,Google的Gemini Pro 2.5和Anthropic的Claude 3.7,它們是世界上最好的封閉源AI模型。 LiveBench說,Openai最受歡迎的AI模型O3-Mini High是全球最好的。 Microsoft支持Openai。

每100萬個令牌,運行O3需要10美元。另一方面,QWEN3使用更便宜,因爲它的運行費用僅爲每100萬個令牌0.55美元。由於Qwen3更便宜並且效果更好,因此許多企業表示,一旦出現,他們就會支持阿里巴巴的最新AI模型。

華爲技術,摩爾線程,劍橋技術和Hygon信息技術都是籌碼公司,他們表示將支持Qwen3。

劍橋上週二表示,它已成功優化了QWEN3,以迅速運行其圖形處理單元。之所以這樣做,是因爲菲律賓的AI開發人員想要中國製造的籌碼。

QWEN3也用於雙曲線和煙火的雲計算服務,AI,兩家AI基礎架構公司。美國芯片製造商Nvidia和Intel已開始支持Qwen3。

中國的許多大數據中心,例如北京,上海,杭州,霍貝,吉林和西北山脈省的許多大數據中心也表示,他們將使用阿里巴巴的第三代Qwen AI模型。中國的超級計算網絡也採用了QWEN3。該網絡在14個省的20個城鎮中鏈接了20多個數據中心。

Anthropic首席執行官說,DeepSeek“有點誇張”

在商業活動中,該公司製作了Claude AI模型的公司的共同創始人表示,DeepSeek仍然“落後於美國邊境公司的六到八個月”。他還說,最近對中國初創企業的嗡嗡聲“也許有點誇張”。

DeepSeek於2024年12月下旬和2025年1月初在全球引起了人們的關注,分享了兩種高級開源AI型號V3和R1。這些模型是大型科技公司通常需要在LLM項目中需要的一小部分成本和計算能力的模型。

目前尚不清楚DeepSeek何時會發佈下一代模型。4月下旬悄悄發佈了其6710億參數Prover-V2 。這是對其處理數學證明的專業模型的更新。但是,它並沒有說明其期待已久的R2推理模型的進展。

2025年DeFi賺取被動收入的新方法。瞭解更多

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。
Tradingkey

相關文章

KeyAI