
上海5月29日 - 中国人工智能初创公司DeepSeek周四凌晨发布了R1推理模型的更新版本,加强了与OpenAI等美国同业的竞争。
DeepSeek 在开发者平台 Hugging Face 上发布了 R1-0528,但尚未正式公布。它没有公布模型的具体描述或对比情况。
但在由加州大学伯克利分校、麻省理工学院和康奈尔大学的研究人员开发的基准测试 LiveCodeBench排行榜上,DeepSeek 更新后的 R1 推理模型在代码生成方面仅略逊于 OpenAI 的 o4 mini 和 o3 推理模型,领先于 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3。
彭博新闻周三早些时候报道了这一更新。彭博称,DeepSeek 的一位代表在微信群中表示,DeepSeek 已经完成了所谓的 "小版本试升级",用户可以开始测试。
R1 于 1 月份发布,导致中国以外的科技股在 1 月份暴跌,并对"扩大人工智能规模需要庞大的计算能力和投资 "这一观点提出了挑战。自 R1 发布以来,阿里巴巴 9988.HK 和腾讯 0700.HK 等中国科技巨头都发布了声称超过 DeepSeek 的模型。
人们仍普遍预计DeepSeek将发布 R1 的后续产品 R2。路透 3 月份援引消息人士的话报道称,R2 最初计划于 5 月份发布。DeepSeek 还在 3 月份 发布了V3 大型语言模型的升级版。(完)