添加超链接的更新
Eduardo Baptista
路透社北京1月28日 - 中国初创公司DeepSeek推出了最新的人工智能模型,称其成本仅为美国业界领先模型的一小部分,但性能却与之不相上下,甚至更胜一筹。
该公司在上个月的一篇论文中写道,DeepSeek-V3 的训练只需要价值不到 600 万美元的英伟达 H800 芯片的计算能力,这引起了全球人工智能圈的关注。
由DeepSeek-V3驱动的DeepSeek人工智能助手已超越 (link),成为美国苹果公司App Store上评分最高的 免费应用。
这让人们对一些美国科技公司决定承诺数十亿美元人工智能投资背后的理由产生了怀疑,包括英伟达在内的几家大型科技企业的股票 (link)。
以下是有关这家撼动全球人工智能领域的公司的一些事实。
Deepseek 为何引起轰动?
2022 年末,OpenAI 的 ChatGPT 发布后,引起了中国科技公司 (link) 的争相效仿,他们急于创建自己的人工智能聊天机器人。
但是,在搜索引擎巨头百度9888.HK发布了中国第一个等效的ChatGPT之后,中国 (link),人们普遍对中美企业在人工智能能力上的差距感到失望。
DeepSeek 模型的质量和成本效益颠覆了这种说法。这家中国初创公司表示,DeepSeek-V3 和 DeepSeek-R1 这两个模型得到了硅谷高管和美国科技公司工程师的一致好评,它们与 OpenAI 和 Meta 最先进的模型不相上下。
它们的使用成本也更低。根据 DeepSeek 官方微信账号上的一篇文章,上周发布的 DeepSeek-R1 的使用成本比 OpenAI o1 模型低 20 到 50 倍,具体取决于任务。
但也有人公开对 DeepSeek 的成功故事表示怀疑 (link)。
Scale AI首席执行官亚历山大-王(Alexandr Wang)周四在接受CNBC采访时说,DeepSeek拥有5万块英伟达H100芯片,但他没有提供证据,他声称不会透露这些芯片,因为这违反了华盛顿禁止向中国公司出售此类先进人工智能芯片的出口管制规定。DeepSeek 没有立即回应就这一指控发表评论的请求。
伯恩斯坦(Bernstein)分析师周一在一份研究报告中强调,DeepSeek V3 模型的总训练成本尚不清楚,但远高于该初创公司所说的用于计算能力的 558 万美元。分析师还表示,同样备受赞誉的 R1 模型的培训成本也未披露。
Deepseek 背后是谁?
根据中国公司记录,DeepSeek 是一家位于杭州的初创公司,其控股股东是定量对冲基金 High-Flyer 的联合创始人梁文峰 (link)。
梁文峰的基金于 2023 年 3 月在其官方微信账号上宣布 "重新出发",超越交易,集中资源创建一个 "全新的独立研究小组,探索 AGI 的本质"(人工通用智能)。DeepSeek 于当年晚些时候成立。
ChatGPT 制造商 OpenAI 将 AGI 定义为在最具经济价值的任务中超越人类的自主系统。
目前还不清楚 High-Flyer 在 DeepSeek 上投入了多少资金。根据中国企业的记录,高朋公司与 DeepSeek 在同一栋大楼里办公,它还拥有用于训练人工智能模型的芯片集群的相关专利。
2022 年 7 月,High-Flyer 的人工智能部门在其官方微信账号上表示,它拥有并运营着一个由 10,000 个 A100 芯片组成的集群。
北京如何看待 Deepseek?
DeepSeek 的成功已经引起了中国政界高层的关注。据中国国家通讯社新华社报道,1月20日,也就是DeepSeek-R1向公众发布的当天,创始人梁建章出席了由中国国务院总理李强主持的企业家和专家闭门座谈会。
梁建章出席这次会议可能表明,DeepSeek 的成功对中国政府克服华盛顿的出口管制 (link)、实现人工智能等战略产业自给自足的政策目标具有重要意义。
百度首席执行官李彦宏也出席了去年的类似研讨会。