tradingkey.logo

OpenAI開源BrowseComp,重塑Agent瀏覽器評測

金色財經2025年4月10日 20:44
金色財經報道,今天凌晨2點,OpenAI開源了專門用於智能體瀏覽器功能的測試基準——BrowseComp。這個測試基準非常有難度,連OpenAI自己的GPT-4o、GPT-4.5準確率只有0.6%和0.9%幾乎爲0,即便使用帶瀏覽器功能的GPT-4o也只有1.9%。但OpenAI最新發布的Agent模型Deep Research準確率高達51.5%,在自主搜索、信息整合、準確性校準方面非常優秀。(AIGC開放社區)
免責聲明:本網站提供的資訊僅供教育和參考之用,不應視為財務或投資建議。
Tradingkey

相關文章

KeyAI