
路透北京3月6日 - 中國互聯網巨頭--阿里巴巴9988.HKBABA.N旗下阿里雲周四發布並開源全新的推理模型通義千問QwQ-32B;該公司並稱,通過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力上實現質的飛躍,整體性能比肩DeepSeek-R1。
阿里雲在微信公眾號發布的新聞稿指出,千問QwQ-32B還大幅降低了部署使用成本,在消費級顯卡上也能實現本地部署。在冷啟動基礎上,通義團隊針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習,在32B的模型尺寸上獲得了令人驚喜的推理能力提升。
“在一系列權威基準測試中,千問QwQ-32B 模型表現異常出色,幾乎完全超越了OpenAI-o1-mini,比肩最強開源推理模型DeepSeek-R1。”阿里雲表示。
同時阿里雲採用寬鬆的Apache2.0協議,將千問QwQ-32B模型向全球開源,所有人都可免費下載及商用。
今年以來在中國人工智能(AI)初創公司DeepSeek橫空出世後,中國AI競爭的格局在快速重塑。上周阿里巴巴旗下AI創意作畫平台--通義萬相團隊表示,將開源旗下視頻生成模型“萬相2.1”。
今年的中國政府工作報告亦再度將科技發展與創新置于“聚光燈”下。分析人士認為,中國推進人工智能等發展有利於推動實現經濟增長目標;預計今年“AI+”將迅速落地並賦能千行萬業,同時各層級政府對於新質生產力、尤其是“AI+”方向的政策扶持力度預計會大幅增加。(完)