9月24日,阿里巴巴美股夜盤、H股均漲超7%!正式推出其迄今爲止規模最大、能力最強的模型 Qwen3-Max。
據通義千問Qwen公衆號消息:繼 Qwen3-2507 系列發佈之後,我們非常高興地推出 Qwen3-Max —— 我們迄今爲止規模最大、能力最強的模型。目前,Qwen3-Max-Instruct 的預覽版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代碼能力和智能體(agent)能力方面進一步提升,在涵蓋知識、推理、編程、指令遵循、人類偏好對齊、智能體任務和多語言理解的全面基準測試中均達到業界領先水平。
我們誠邀您通過阿里雲 API 體驗 Qwen3-Max-Instruct,或直接在 Qwen Chat 上進行試用。與此同時,仍在訓練中的 Qwen3-Max-Thinking 已展現出非凡潛力。在結合工具使用並增加測試時計算資源的情況下,該“思考”版本已在 AIME 25、HMMT 等高難度推理基準測試中取得 100% 的準確率。我們期待在不久的將來向公衆正式發佈這一版本。
Qwen3-Max-Base
Qwen3-Max模型總參數超過1T,預訓練使用了36T tokens。模型結構沿用了Qwen3系列的模型結構設計範式,使用了我們提出的global-batch load balancing loss。
Qwen3-Max-Instruct
Qwen3-Max-Instruct的預覽版已在 LMArena 文本排行榜上穩居全球前三。正式發佈版本進一步提升了其能力,尤其在代碼生成與智能體表現方面表現卓越。在專注於解決現實編程挑戰的基準測試 SWE-Bench Verified 上,Qwen3-Max-Instruct 取得了高達69.6分的優異成績,穩居全球頂尖模型之列。此外,在評估智能體工具調用能力的嚴苛基準 Tau2-Bench 上,Qwen3-Max-Instruct 更是實現了突破性表現,以74.8分超越 Claude Opus 4與 DeepSeek-V3.1。
Qwen3-Max-Thinking(Heavy)
Qwen3-Max 的推理增強版本—— Qwen3-Max-Thinking,通過集成代碼解釋器並運用並行測試時計算技術,展現了前所未有的推理能力,尤其在極具挑戰性的數學推理基準測試 AIME 25 和 HMMT 上,均取得了滿分。目前,我們正在全力推進 Qwen3-Max-Thinking 的訓練,期待儘快能讓用戶體驗。
使用Qwen3-Max進行開發
現在,您可以在 Qwen Chat 官網(chat.qwen.ai)直接與強大的 Qwen3-Max-Instruct 模型對話,體驗其卓越能力。同時,該模型的 API(模型名稱爲 qwen3-max)也已開放使用。
您只需按以下步驟操作,即可快速接入API:
註冊阿里雲賬號:前往阿里雲官網。
開通服務:激活阿里雲 Model Studio。
獲取密鑰:登錄控制檯,創建您的專屬 APIKey。