TradingKey - 北京时间2025年8月21日下午,DeepSeek正式发布DeepSeek-V3.1模型,其通过采用全新的混合推理架构和更强大的Agent能力在代码修复和命令行终端任务等测试中实现了性能的显著提升。
据DeepSeek公告,新模型主要包括以下变化:
1、混合推理架构:一个模型同时支持思考模式和非思考模式;
2、更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案;
3、更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的额表现有较大提升。
DeepSeek API进行了同步升级,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文已拓展至128K。混合推理架构的更新被普遍视为该模型的核心升级。
DeepSeek官方表示,這是他们迈向代理时代的第一步。
据官方展示的编程智能体相关的能力测试中,DeepSeek-V3.1模型在代码修复测试和命令行终端测试环境下的复杂任务测试得分远超此前模型。
【来源:DeepSeek】
有熟悉AI模型的网友评论,如果只是一次实验性的关于Chat、Reasoning模型融合的测试,这次模型升级是一次“合格”的增量更新。相较于单独部署两套模型,这种更新能够节约很多部署运维的精力、提高算力利用效率。
但同时,最新的模型存在AI幻觉和中英文混杂等问题,业界期盼有重大升级的V4模型或R2模型。