tradingkey.logo

DeepSeek-V3.1模型發佈,這次帶來哪些重點更新?

TradingKey2025年8月21日 09:21

TradingKey - 北京時間2025年8月21日下午,DeepSeek正式發佈DeepSeek-V3.1模型,其通過採用全新的混合推理架構和更強大的Agent能力在代碼修復和命令行終端任務等測試中實現了性能的顯著提升。

據DeepSeek公告,新模型主要包括以下變化:

1、混合推理架構:一個模型同時支持思考模式和非思考模式;

2、更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短時間內給出答案;

3、更強的Agent能力:通過Post-Training優化,新模型在工具使用與智能體任務中的額表現有較大提升。

DeepSeek API進行了同步升級,deepseek-chat對應非思考模式,deepseek-reasoner對應思考模式,且上下文已拓展至128K。混合推理架構的更新被普遍視為該模型的核心升級。

DeepSeek官方表示,這是他們邁向代理時代的第一步。

據官方展示的編程智能體相關的能力測試中,DeepSeek-V3.1模型在代碼修復測試和命令行終端測試環境下的復雜任務測試得分遠超此前模型。

deepseek-model-test

【來源:DeepSeek】

有熟悉AI模型的網友評論,如果只是一次實驗性的關於Chat、Reasoning模型融合的測試,這次模型升級是一次“合格”的增量更新。相較於單獨部署兩套模型,這種更新能夠節約很多部署運維的精力、提高算力利用效率。

但同時,最新的模型存在AI幻覺和中英文混雜等問題,業界期盼有重大升級的V4模型或R2模型。

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。

相關文章

KeyAI