
El director ejecutivo de OpenAI, Sam Altman, había estado insinuando GPT-5 durante meses. Afirmaba que se trataba de un modelo avanzado: más inteligente, más rápido y capaz de pensar a nivel de doctorado. La compañía presentó este lanzamiento como un gran avance para ChatGPT, destinado a impulsar mejoras de inteligencia en la codificación, el razonamiento y la precisión.
Pero las primeras reacciones pintan un panorama más confuso . Los desarrolladores elogiaron el modelo por comprender indicaciones complejas y generar código bien estructurado. El primer probador, Simon Willison, describió GPT-5 como "competente" y "a veces impresionante", pero no representaba un gran avance respecto a GPT-4. Otros se mostraron menos impresionados.
Varias publicaciones en redes sociales rápidamente se convirtieron en quejas sobre numerosos errores factuales, deficiencias en las habilidades matemáticas y, en algunos casos, incluso errores ortográficos básicos. Noah Giansiracusa, profesor de matemáticas de la Universidad de Bentley, calificó el comunicado de "decepcionante" y señaló que las actualizaciones en cuestión parecían "más marginales de lo que esperaba".
Parte de la confusión se debía a la arquitectura del modelo. GPT-5 incluía un selector automático para los distintos tamaños de modelo , según su tarea. Esto ahorra procesamiento y evita tener que tocar constantemente el GPT-5 completo, lo que provocaba errores de acceso oculto en muchos usuarios. Al responder incorrectamente una pregunta con el sistema, el agente con el que trabajaba le indicó que "pensara mejor" sobre cuántas letras "b" tiene la palabra "blueberry". Tras esa retroalimentación, obtuvo la respuesta correcta.
La frustración podría extenderse a Reddit y X el viernes. Y aunque algunos usuarios detestaban no saber de quién o incluso de qué modelo provenía el texto, muchos sentían que el infierno era solo una inferencia, y que GPT5 había reemplazado a sus antiguos favoritos en los que confiaban. Algunos comentaron que la calidad se había visto afectada, que la escritura no era tan buena como la de GPT-4.5 (como ustedes coincidieron que debería ser), y que algunos aspectos creativos y técnicos habían empeorado.
Esta charla llevó al director ejecutivo de OpenAI a participar en una sesión de preguntas y respuestas en Reddit para abordar las críticas. Explicó que un error en el selector automático impidió que GPT-5 funcionara por debajo de su máximo potencial desde el primer día. Prometió mayor transparencia en futuras transiciones de modelos: «A partir de hoy, GPT-5 debería ser cada vez más inteligente». OpenAI también prometió volver a implementar modelos anteriores, como GPT-4o, para quienes expresaron su preferencia, en un esfuerzo por apaciguar a las críticas más fuertes.
El hecho de que necesitara actuar con tanta rapidez pone de manifiesto lo mucho que había en juego. Hoy en día, OpenAI se encuentra en una carrera vertiginosa con competidores como Anthropic, Google DeepMind e incluso xAI de Elon Musk. Con tanta competencia, un pequeño desliz y pronto tu competidor te llevará ventaja.
A pesar de estas diferencias, la acogida de GPT-5 fue tibia, pero eso no impidió que alcanzara el primer puesto en LMArena, una tabla de clasificación impulsada por el usuario para modelos de entrenamiento. Si bien no era lo que hoy consideraríamos programable, era extremadamente rápido y expresivo, y admitía consultas grandes y complejas. Sin embargo, otros benchmarks mostraron un panorama de problemas diferente y más desafiante. Grok 4, de xAI de Musk, obtuvo una puntuación tan alta en ARC-AGI-2 (un conjunto de pruebas para razonamiento avanzado) que representó un desafío significativo para la supremacía de OpenAI.
Algunos analistas del sector especulan que pasará al menos un día antes de que se comprendan plenamente los efectos de GPT-5, similar a avances anteriores de la empresa, como GPT-3. GPT-5 y GPT-4 recibieron una fuerte reacción negativa antes de ver mejoras en actualizaciones y otros casos de uso. El modelo tiene el potencial de tener éxito (o fracasar) dependiendo de su utilidad para el flujo de trabajo diario, y hay casi 700 millones de usuarios semanales de ChatGPT en todo el mundo.
En palabras del profesor de Wharton Ethan Mollick: «El GPT-5 simplemente hace cosas, a veces asombrosas, a veces desconcertantes, por sí solo. Eso es lo que lo hace tan intrigante. Sigue siendo un enfoque tecnocrático y un tanto inquietante calificar de «interesantes» este tipo de cuestiones de la esfera de la salud pública».
No te limites a leer noticias sobre criptomonedas. Entiéndelas. Suscríbete a nuestro boletín. Es gratis .