tradingkey.logo

OpenAI发布两款开放权重模型,未公布与DeepSeek对比指标

路透社2025年8月6日 03:32

- OpenAI周二表示,已发布两款开放权重(open-weight)语言模型,这些模型在高级推理方面表现出色,并经过优化,可在笔记本电脑上运行,性能与其小型专门推理模型相似。

该公司表示,这两款模型中,较大的gpt-oss-120b模型可以在单个GPU上运行,而更小的gpt-oss-20b模型则可以直接在个人电脑上运行。这两款新模型是 OpenAI 自 2019 年发布 GPT-2 以来首次发布的开放模型。

OpenAI表示,这两款模型的性能与其名为o3-mini和o4-mini的专门推理模型相似,尤其擅长编码、竞赛数学和健康相关的查询。

OpenAI 没有公布将这两款开放权重模型与 DeepSeek-R1 模型等竞争对手进行比较的指标。

DeepSeek今年5月发布新版R1推理模型,称能对标OpenAI、谷歌的顶尖模型。DeepSeek继续开源了新版R1的模型,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。nL3S3S111O

开放权重语言模型的训练参数或权重是公开的,开发人员可以使用它来分析和微调特定任务的模型,而无需原始训练数据。它不同于开源(open-source)模型,后者提供完整的源代码、训练数据和方法。(完)

免责声明:本网站提供的信息仅供教育和参考之用,不应视为财务或投资建议。
Tradingkey

相关文章

KeyAI