OpenAI GPT-5 上市第一天就引发褒贬不一的评价

Cryptopolitan2025年8月9日 01:13

OpenAI 首席执行官 Sam Altman 几个月来一直在预告 GPT-5。他声称这是一个先进的模型——更智能、更快速，并且能够达到“博士级”的思维能力。该公司将此次发布定位为 ChatGPT 向前迈出的重要一步——旨在提升编码、推理和准确性方面的智能。

但早期的反应却让人感到困惑。开发人员称赞该模型能够理解复杂的提示并输出结构良好的代码。早期测试人员西蒙·威利森 (Simon Willison) 认为 GPT-5“能力出色”且“偶尔令人印象深刻”，但与 GPT-4 相比并没有太大的飞跃。其他人则不那么印象深刻。

社交媒体上的几篇帖子很快就转向了对大量事实错误、数学技能薄弱，以及少数情况下甚至基本的拼写错误的抱怨。本特利大学数学教授诺亚·吉安西拉库萨称这份报告“令人失望”，并指出这些更新“比我预期的还要边缘化”。

造成部分混乱的原因在于模型的架构。GPT-5 会根据其任务，包含一个适用于各种模型尺寸的。这节省了处理时间，意味着你不必总是接触完整的 GPT-5，而 GPT-5 正是这种机制给许多人带来了后门。当系统错误地回答问题时，与之合作的智能体会指示它“更努力地思考”蓝莓中有多少个“b”字母。在得到反馈后，系统在被问到这个问题时给出了正确的答案。

用户反击——OpenAI 做出回应

这种挫败感可能会在周五蔓延到 Reddit 和 X。虽然有些用户讨厌不知道文本来自谁，甚至不知道哪个模型，但许多人觉得“地狱”只是一个推论，GPT5 取代了他们曾经信任的旧模型。少数人表示，质量受到了影响，写作不如GPT-4.5 （你们都同意 GPT-4.5 应该如此），一些创意和技术方面感觉更糟。

这次谈话促使OpenAI的首席执行官参与了Reddit上的“问我任何事”（Ask Me Anything）活动，旨在解决外界的强烈反对。他表示，自动切换器的一个漏洞导致GPT-5在第一天就未能充分发挥其潜力。他承诺在未来的模型转换中将更加透明：“从今天开始，GPT-5应该看起来越来越智能。” OpenAI还承诺，将为那些表达了偏好的用户重新部署GPT-4o等早期模型，以平息那些最激烈的批评者。

它需要如此迅速地采取行动，凸显了风险有多大。如今，OpenAI 正与 Anthropic、谷歌 DeepMind，甚至埃隆·马斯克的 xAI 等竞争对手展开激烈竞争。在如此激烈的竞争中，稍有闪失，你的竞争对手很快就会领先你一步。

人工智能竞赛愈演愈烈

即使存在这些差异，GPT-5 的反响也并不热烈，但这并没有阻止它在 LMArena（一个用户驱动的训练模型排行榜）上名列前茅。虽然它并非我们今天所认为的可编程模型，但它速度极快，表达能力极强，支持大型复杂查询。然而，其他基准测试却展现出截然不同、更具挑战性的问题格局。马斯克 xAI 的在 ARC-AGI-2（一组高级推理测试）上得分极高，对 OpenAI 的霸主地位构成了重大挑战。

一些行业分析师推测，GPT-5 的效果至少还需要一天时间才能被完全理解，就像该公司之前的突破性成果（例如 GPT-3）一样。GPT-5 和 GPT-4 在更新和其他用例中有所改进之前，曾遭遇过强烈的反对。该模型的成功（或失败）取决于它对人们日常工作流程的实用性，全球每周有近 7 亿 ChatGPT 用户。

沃顿商学院教授伊桑·莫里克（Ethan Mollick）曾说过：“GPT-5 确实能做一些事情，有时令人惊叹，有时令人费解，完全是它自己做的。这正是它如此引人入胜的原因。用技术官僚的口吻来形容公共卫生领域的这种事情‘有趣’，仍然有点令人毛骨悚然。”

不要只阅读加密货币新闻。了解它。订阅我们的新闻通讯。免费。

免责声明：本网站提供的信息仅供教育和参考之用，不应视为财务或投资建议。

Tradingkey