
路透上海5月29日 - 中国人工智能初创公司--DeepSeek周四发布了R1推理模型的更新版本,加强了与OpenAI等美国同业的竞争。公司声称新版R1模型强化了深度思考能力,并能够对标OpenAI和谷歌GOOGL.O推出的一些顶尖模型。
DeepSeek当日凌晨在开发者平台Hugging Face上发布了版本号“ DeepSeek-R1-0528”的新版R1推理模型,但并未在第一时间公布该模型的升级内容。
DeepSeek当日晚间在微信公众号发文,披露了该模型的更多细节。该公司表示,新版R1仍然使用去年12月发布的DeepSeek V3 Base模型作为基座,在后训练过程中投入了更多算力,显著提升了思维深度与推理能力。
DeepSeek宣称,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如OpenAI的o3,与谷歌的Gemini-2.5-Pro。
此外,新版R1针对“幻觉”问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降低45-50%左右,能够有效地提供更为准确、可靠的结果。
其他方面的提升包括更贴近人类偏好的创意写作,以及更好的前端代码生成、角色扮演能力。
DeepSeek继续开源了新版R1的模型,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
首版R1于1月份发布,导致中国以外的科技股在1月份暴跌,并对"扩大人工智能规模需要庞大的计算能力和投资 "这一观点提出了挑战。自 R1 发布以来,阿里巴巴 9988.HK 和腾讯 0700.HK 等中国科技巨头都发布了声称超过DeepSeek的模型。
人们仍普遍预计DeepSeek将发布R1的后续产品R2。路透3月份援引消息人士的话报道称,R2最初计划于5月份发布。DeepSeek还在3月份发布V3大型语言模型的升级版。(完)