路透旧金山8月5日 - OpenAI周二表示,已发布两款开放权重(open-weight)语言模型,这些模型在高级推理方面表现出色,并经过优化,可在笔记本电脑上运行,性能与其小型专门推理模型相似。
该公司表示,这两款模型中,较大的gpt-oss-120b模型可以在单个GPU上运行,而更小的gpt-oss-20b模型则可以直接在个人电脑上运行。这两款新模型是 OpenAI 自 2019 年发布 GPT-2 以来首次发布的开放模型。
OpenAI表示,这两款模型的性能与其名为o3-mini和o4-mini的专门推理模型相似,尤其擅长编码、竞赛数学和健康相关的查询。
OpenAI 没有公布将这两款开放权重模型与 DeepSeek-R1 模型等竞争对手进行比较的指标。
DeepSeek今年5月发布新版R1推理模型,称能对标OpenAI、谷歌的顶尖模型。DeepSeek继续开源了新版R1的模型,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。nL3S3S111O
开放权重语言模型的训练参数或权重是公开的,开发人员可以使用它来分析和微调特定任务的模型,而无需原始训练数据。它不同于开源(open-source)模型,后者提供完整的源代码、训练数据和方法。(完)