OpenAI 首席执行官 Sam Altman 几个月来一直在预告 GPT-5。他声称这是一个先进的模型——更智能、更快速,并且能够达到“博士级”的思维能力。该公司将此次发布定位为 ChatGPT 向前迈出的重要一步——旨在提升编码、推理和准确性方面的智能。
但早期的反应却让人感到困惑。开发人员称赞该模型能够理解复杂的提示并输出结构良好的代码。早期测试人员西蒙·威利森 (Simon Willison) 认为 GPT-5“能力出色”且“偶尔令人印象深刻”,但与 GPT-4 相比并没有太大的飞跃。其他人则不那么印象深刻。
社交媒体上的几篇帖子很快就转向了对大量事实错误、数学技能薄弱,以及少数情况下甚至基本的拼写错误的抱怨。本特利大学数学教授诺亚·吉安西拉库萨称这份报告“令人失望”,并指出这些更新“比我预期的还要边缘化”。
造成部分混乱的原因在于模型的架构。GPT-5 会根据其任务,包含一个适用于各种模型尺寸的 。这节省了处理时间,意味着你不必总是接触完整的 GPT-5,而 GPT-5 正是这种机制给许多人带来了后门。当系统错误地回答问题时,与之合作的智能体会指示它“更努力地思考”蓝莓中有多少个“b”字母。在得到反馈后,系统在被问到这个问题时给出了正确的答案。
这种挫败感可能会在周五蔓延到 Reddit 和 X。虽然有些用户讨厌不知道文本来自谁,甚至不知道哪个模型,但许多人觉得“地狱”只是一个推论,GPT5 取代了他们曾经信任的旧模型。少数人表示,质量受到了影响,写作不如GPT-4.5 (你们都同意 GPT-4.5 应该如此),一些创意和技术方面感觉更糟。
这次谈话促使OpenAI的首席执行官参与了Reddit上的“问我任何事”(Ask Me Anything)活动,旨在解决外界的强烈反对。他表示,自动切换器的一个漏洞导致GPT-5在第一天就未能充分发挥其潜力。他承诺在未来的模型转换中将更加透明:“从今天开始,GPT-5应该看起来越来越智能。” OpenAI还承诺,将为那些表达了偏好的用户重新部署GPT-4o等早期模型,以平息那些最激烈的批评者。
它需要如此迅速地采取行动,凸显了风险有多大。如今,OpenAI 正与 Anthropic、谷歌 DeepMind,甚至埃隆·马斯克的 xAI 等竞争对手展开激烈竞争。在如此激烈的竞争中,稍有闪失,你的竞争对手很快就会领先你一步。
即使存在这些差异,GPT-5 的反响也并不热烈,但这并没有阻止它在 LMArena(一个用户驱动的训练模型排行榜)上名列前茅。虽然它并非我们今天所认为的可编程模型,但它速度极快,表达能力极强,支持大型复杂查询。然而,其他基准测试却展现出截然不同、更具挑战性的问题格局。马斯克 xAI 的在 ARC-AGI-2(一组高级推理测试)上得分极高,对 OpenAI 的霸主地位构成了重大挑战。
一些行业分析师推测,GPT-5 的效果至少还需要一天时间才能被完全理解,就像该公司之前的突破性成果(例如 GPT-3)一样。GPT-5 和 GPT-4 在更新和其他用例中有所改进之前,曾遭遇过强烈的反对。该模型的成功(或失败)取决于它对人们日常工作流程的实用性,全球每周有近 7 亿 ChatGPT 用户。
沃顿商学院教授伊桑·莫里克(Ethan Mollick)曾说过:“GPT-5 确实能做一些事情,有时令人惊叹,有时令人费解,完全是它自己做的。这正是它如此引人入胜的原因。用技术官僚的口吻来形容公共卫生领域的这种事情‘有趣’,仍然有点令人毛骨悚然。”
不要只阅读加密货币新闻。了解它。订阅我们的新闻通讯。免费。