金吾财讯 | 中信建投发研报指,据官方公众号,DeepSeek今日正式发布DeepSeek-V3.1。目前官网与网页端模型已升级至最新版本,且新模型已在Huggingface开源。新版本模型主要升级体现在以下维度:(1)一个模型同时支持思考模式与非思考模式;(2)相比前代模型,新模型思考模式下能在更短时间内给出答案;(3)通过Post-Training优化,新模型具备更强的Agent能力。除去功能升级,新版本模型使用了UE8M0 FP8 Scale参数精度,该参数代表模型支持转为矩阵乘法等AI核心运算优化设计的FP8精度格式。相比FP16格式,FP8在同等芯片面积下能够实现翻倍性能,且功耗和带宽需求更低。此外,DeepSeek表示新精度格式针对即将发布的下一代国产芯片设计,表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。
该机构表示,DeepSeek更新模型,明确支持FP8精度与将发布的下一代国产芯片,头部国产开源模型对国产芯片的支持有望推动国产算力生态加速落地。