OpenAI GPT-5 上市第一天就引發褒貶不一的評價

Cryptopolitan2025年8月9日 01:13

OpenAI 首席執行官 Sam Altman 幾個月來一直在預告 GPT-5。他聲稱這是一個先進的模型——更智能、更快速，並且能夠達到“博士級”的思維能力。該公司將此次發佈定位爲 ChatGPT 向前邁出的重要一步——旨在提升編碼、推理和準確性方面的智能。

但早期的反應卻讓人感到困惑。開發人員稱讚該模型能夠理解複雜的提示並輸出結構良好的代碼。早期測試人員西蒙·威利森 (Simon Willison) 認爲 GPT-5“能力出色”且“偶爾令人印象深刻”，但與 GPT-4 相比並沒有太大的飛躍。其他人則不那麼印象深刻。

社交媒體上的幾篇帖子很快就轉向了對大量事實錯誤、數學技能薄弱，以及少數情況下甚至基本的拼寫錯誤的抱怨。本特利大學數學教授諾亞·吉安西拉庫薩稱這份報告“令人失望”，並指出這些更新“比我預期的還要邊緣化”。

造成部分混亂的原因在於模型的架構。GPT-5 會根據其任務，包含一個適用於各種模型尺寸的。這節省了處理時間，意味着你不必總是接觸完整的 GPT-5，而 GPT-5 正是這種機制給許多人帶來了後門。當系統錯誤地回答問題時，與之合作的智能體會指示它“更努力地思考”藍莓中有多少個“b”字母。在得到反饋後，系統在被問到這個問題時給出了正確的答案。

用戶反擊——OpenAI 做出回應

這種挫敗感可能會在週五蔓延到 Reddit 和 X。雖然有些用戶討厭不知道文本來自誰，甚至不知道哪個模型，但許多人覺得“地獄”只是一個推論，GPT5 取代了他們曾經信任的舊模型。少數人表示，質量受到了影響，寫作不如GPT-4.5 （你們都同意 GPT-4.5 應該如此），一些創意和技術方面感覺更糟。

這次談話促使OpenAI的首席執行官參與了Reddit上的“問我任何事”（Ask Me Anything）活動，旨在解決外界的強烈反對。他表示，自動切換器的一個漏洞導致GPT-5在第一天就未能充分發揮其潛力。他承諾在未來的模型轉換中將更加透明：“從今天開始，GPT-5應該看起來越來越智能。” OpenAI還承諾，將爲那些表達了偏好的用戶重新部署GPT-4o等早期模型，以平息那些最激烈的批評者。

它需要如此迅速地採取行動，凸顯了風險有多大。如今，OpenAI 正與 Anthropic、谷歌 DeepMind，甚至埃隆·馬斯克的 xAI 等競爭對手展開激烈競爭。在如此激烈的競爭中，稍有閃失，你的競爭對手很快就會領先你一步。

人工智能競賽愈演愈烈

即使存在這些差異，GPT-5 的反響也並不熱烈，但這並沒有阻止它在 LMArena（一個用戶驅動的訓練模型排行榜）上名列前茅。雖然它並非我們今天所認爲的可編程模型，但它速度極快，表達能力極強，支持大型複雜查詢。然而，其他基準測試卻展現出截然不同、更具挑戰性的問題格局。馬斯克 xAI 的在 ARC-AGI-2（一組高級推理測試）上得分極高，對 OpenAI 的霸主地位構成了重大挑戰。

一些行業分析師推測，GPT-5 的效果至少還需要一天時間才能被完全理解，就像該公司之前的突破性成果（例如 GPT-3）一樣。GPT-5 和 GPT-4 在更新和其他用例中有所改進之前，曾遭遇過強烈的反對。該模型的成功（或失敗）取決於它對人們日常工作流程的實用性，全球每週有近 7 億 ChatGPT 用戶。

沃頓商學院教授伊桑·莫里克（Ethan Mollick）曾說過：“GPT-5 確實能做一些事情，有時令人驚歎，有時令人費解，完全是它自己做的。這正是它如此引人入勝的原因。用技術官僚的口吻來形容公共衛生領域的這種事情‘有趣’，仍然有點令人毛骨悚然。”

不要只閱讀加密貨幣新聞。瞭解它。訂閱我們的新聞通訊。免費。

免責聲明：本網站提供的資訊僅供教育和參考之用，不應視為財務或投資建議。

讚

OpenAI GPT-5 上市第一天就引發褒貶不一的評價

用戶反擊——OpenAI 做出回應

人工智能競賽愈演愈烈

推薦文章

AI記憶體巨頭SK海力士扭轉跌勢，盤中急速拉升5%

日韓大盤開盤閃崩：日經、KOSPI驚現連環踩踏，三星SK海力士重挫，鎧俠逆勢上漲

SpaceX股價下跌超5%即將跌破首掛價！旗下數據中心被起訴關停，或危及與Anthropic的450億美元合同

市傳OpenAI即將向公眾推出GPT-5.6，精準卡點Anthropic Fable 5限額失效

SK海力士即將赴美上市，股價為何不漲反跌？