tradingkey.logo

OpenAI發布兩款開放權重模型,未公布與DeepSeek對比指標

路透社2025年8月6日 03:32

- OpenAI周二表示,已發布兩款開放權重(open-weight)語言模型,這些模型在高級推理方面表現出色,並經過優化,可在筆記本電腦上運行,性能與其小型專門推理模型相似。

該公司表示,這兩款模型中,較大的gpt-oss-120b模型可以在單個GPU上運行,而更小的gpt-oss-20b模型則可以直接在個人電腦上運行。這兩款新模型是 OpenAI 自 2019 年發布 GPT-2 以來首次發布的開放模型。

OpenAI表示,這兩款模型的性能與其名為o3-mini和o4-mini的專門推理模型相似,尤其擅長編碼、競賽數學和健康相關的查詢。

OpenAI 沒有公布將這兩款開放權重模型與 DeepSeek-R1 模型等競爭對手進行比較的指標。

DeepSeek今年5月發布新版R1推理模型,稱能對標OpenAI、谷歌的頂尖模型。DeepSeek繼續開源了新版R1的模型,並允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。nL3T3S111O

開放權重語言模型的訓練參數或權重是公開的,開發人員可以使用它來分析和微調特定任務的模型,而無需原始訓練數據。它不同于開源(open-source)模型,後者提供完整的源代碼、訓練數據和方法。(完)

免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。

相關文章

KeyAI