OpenAI 首席執行官 Sam Altman 幾個月來一直在預告 GPT-5。他聲稱這是一個先進的模型——更智能、更快速,並且能夠達到“博士級”的思維能力。該公司將此次發佈定位爲 ChatGPT 向前邁出的重要一步——旨在提升編碼、推理和準確性方面的智能。
但早期的反應卻讓人感到困惑。開發人員稱讚該模型能夠理解複雜的提示並輸出結構良好的代碼。早期測試人員西蒙·威利森 (Simon Willison) 認爲 GPT-5“能力出色”且“偶爾令人印象深刻”,但與 GPT-4 相比並沒有太大的飛躍。其他人則不那麼印象深刻。
社交媒體上的幾篇帖子很快就轉向了對大量事實錯誤、數學技能薄弱,以及少數情況下甚至基本的拼寫錯誤的抱怨。本特利大學數學教授諾亞·吉安西拉庫薩稱這份報告“令人失望”,並指出這些更新“比我預期的還要邊緣化”。
造成部分混亂的原因在於模型的架構。GPT-5 會根據其任務,包含一個適用於各種模型尺寸的 。這節省了處理時間,意味着你不必總是接觸完整的 GPT-5,而 GPT-5 正是這種機制給許多人帶來了後門。當系統錯誤地回答問題時,與之合作的智能體會指示它“更努力地思考”藍莓中有多少個“b”字母。在得到反饋後,系統在被問到這個問題時給出了正確的答案。
這種挫敗感可能會在週五蔓延到 Reddit 和 X。雖然有些用戶討厭不知道文本來自誰,甚至不知道哪個模型,但許多人覺得“地獄”只是一個推論,GPT5 取代了他們曾經信任的舊模型。少數人表示,質量受到了影響,寫作不如GPT-4.5 (你們都同意 GPT-4.5 應該如此),一些創意和技術方面感覺更糟。
這次談話促使OpenAI的首席執行官參與了Reddit上的“問我任何事”(Ask Me Anything)活動,旨在解決外界的強烈反對。他表示,自動切換器的一個漏洞導致GPT-5在第一天就未能充分發揮其潛力。他承諾在未來的模型轉換中將更加透明:“從今天開始,GPT-5應該看起來越來越智能。” OpenAI還承諾,將爲那些表達了偏好的用戶重新部署GPT-4o等早期模型,以平息那些最激烈的批評者。
它需要如此迅速地採取行動,凸顯了風險有多大。如今,OpenAI 正與 Anthropic、谷歌 DeepMind,甚至埃隆·馬斯克的 xAI 等競爭對手展開激烈競爭。在如此激烈的競爭中,稍有閃失,你的競爭對手很快就會領先你一步。
即使存在這些差異,GPT-5 的反響也並不熱烈,但這並沒有阻止它在 LMArena(一個用戶驅動的訓練模型排行榜)上名列前茅。雖然它並非我們今天所認爲的可編程模型,但它速度極快,表達能力極強,支持大型複雜查詢。然而,其他基準測試卻展現出截然不同、更具挑戰性的問題格局。馬斯克 xAI 的在 ARC-AGI-2(一組高級推理測試)上得分極高,對 OpenAI 的霸主地位構成了重大挑戰。
一些行業分析師推測,GPT-5 的效果至少還需要一天時間才能被完全理解,就像該公司之前的突破性成果(例如 GPT-3)一樣。GPT-5 和 GPT-4 在更新和其他用例中有所改進之前,曾遭遇過強烈的反對。該模型的成功(或失敗)取決於它對人們日常工作流程的實用性,全球每週有近 7 億 ChatGPT 用戶。
沃頓商學院教授伊桑·莫里克(Ethan Mollick)曾說過:“GPT-5 確實能做一些事情,有時令人驚歎,有時令人費解,完全是它自己做的。這正是它如此引人入勝的原因。用技術官僚的口吻來形容公共衛生領域的這種事情‘有趣’,仍然有點令人毛骨悚然。”
不要只閱讀加密貨幣新聞。瞭解它。訂閱我們的新聞通訊。免費。