金吾財訊 | 中信建投發研報指,據官方公衆號,DeepSeek今日正式發佈DeepSeek-V3.1。目前官網與網頁端模型已升級至最新版本,且新模型已在Huggingface開源。新版本模型主要升級體現在以下維度:(1)一個模型同時支持思考模式與非思考模式;(2)相比前代模型,新模型思考模式下能在更短時間內給出答案;(3)通過Post-Training優化,新模型具備更強的Agent能力。除去功能升級,新版本模型使用了UE8M0 FP8 Scale參數精度,該參數代表模型支持轉爲矩陣乘法等AI核心運算優化設計的FP8精度格式。相比FP16格式,FP8在同等芯片面積下能夠實現翻倍性能,且功耗和帶寬需求更低。此外,DeepSeek表示新精度格式針對即將發佈的下一代國產芯片設計,表明未來基於DeepSeek模型的訓練與推理有望更多應用國產AI芯片,助力國產算力生態加速建設。
該機構表示,DeepSeek更新模型,明確支持FP8精度與將發佈的下一代國產芯片,頭部國產開源模型對國產芯片的支持有望推動國產算力生態加速落地。