OpenAI ha lanzado oficialmente GPT-5, lo que el CEO Sam Altman describe como otro paso significativo hacia la inteligencia artificial general (AGI). Tras meses de especulación, el modelo más avanzado de OpenAI ya está disponible tanto para usuarios gratuitos como de pago de ChatGPT, así como para desarrolladores a través de la API. Pero ¿Qué hace que GPT-5 se destaque y qué "no dijeron" durante su presentación? A continuación, los detalles.
Un sistema, no solo un modelo
Uno de los aspectos más fascinantes de GPT-5 es que funciona como un sistema, no como un único modelo monolítico. Esta arquitectura de múltiples modelos utiliza un "enrutador" para decidir inteligentemente qué modelo es el más adecuado para cada solicitud o contexto. Esto significa que los problemas complejos pueden dirigirse a un "modelo de razonamiento profundo", mientras que las consultas simples pueden manejarse con un "modelo rápido", lo que permite a OpenAI ahorrar considerablemente en costos de cómputo.
Este sistema también implica un "agentic loop" en segundo plano, lo que permite al modelo probar código, usar herramientas y retroalimentarse durante el procesamiento de información. Esto lo hace especialmente útil para tareas como programación y matemáticas.
Mejoras significativas en todas las áreas
Sam Altman ha comparado la evolución de los modelos de esta manera: GPT-3 era como un estudiante de secundaria, GPT-4 como un estudiante universitario, y GPT-5 es como un experto con nivel de doctorado en todo. Este nuevo modelo presenta mejoras sustanciales en varias áreas clave:
- Razonamiento y resolución de problemas: GPT-5 está diseñado para realizar "razonamientos más profundos" y es particularmente fuerte en "problemas lógicos y procesos de múltiples pasos". Integra funciones de razonamiento desarrolladas en la familia o3, lo que le permite ejecutar múltiples actividades en paralelo.
- Programación: Descrito como "el modelo de programación más potente" y "el modelo más inteligente que han probado" según el CEO de Cursor. Se destaca en "tareas complejas con mínimos mensajes", genera código limpio, mejora la presentación visual del front-end, depura grandes repositorios y realiza llamadas a funciones en formatos abiertos como SQL o shell. Puede pasar de una idea a un prototipo funcional en una sola instrucción.
- Escritura y expresión creativa: GPT-5 ha mejorado sus habilidades de redacción, ofreciendo resultados "refinados" que respetan el tono y el estilo solicitado. También es "menos entusiasta" y usa menos emojis, sonando más humano y menos "cringy" en comparación con versiones anteriores. Hay un gran énfasis en la escritura creativa y expresiva.
- Consultas de salud: OpenAI ha hecho un "gran esfuerzo" en mejorar sus capacidades en el área de salud, reconociendo que muchas personas recurren a la IA para obtener segundas opiniones o saber qué preguntar a sus médicos. El modelo busca proporcionar respuestas confiables y completas en este dominio.
- Análisis de datos: GPT-5 es "mucho más competente en análisis de datos", capaz de realizar ejercicios de clasificación con tablas y gráficos, y explicar claramente su metodología.
- Multimodalidad: GPT-5 puede comprender texto, imágenes, audio y video, con soporte para herramientas como SORA, lo que lo convierte en una IA verdaderamente multimodal. Sin embargo, vale la pena señalar que en el lanzamiento, los modelos principal y mini no admiten audio ni API en tiempo real, aunque esto podría cambiar en versiones futuras.
- “Agentic Behavior” y ejecución de acciones: Más allá de hacer sugerencias, GPT-5 tiene la capacidad de "ejecutar acciones directamente". Puede integrarse con software de terceros para realizar tareas de forma autónoma, como redactar y enviar correos electrónicos, gestionar respuestas, agendar citas y actualizar agendas.
- Memoria y ventana de contexto: Un avance importante es su mayor capacidad de memoria y procesamiento. El modelo principal de GPT-5 tiene una ventana de contexto de 400,000 tokens, y su modelo base alcanza hasta un millón. Esto le permite analizar bases de datos completas, mantener conversaciones durante semanas o gestionar información acumulada por años. También soporta una salida máxima de hasta 128,000 tokens, lo que significa que puede reescribir una novela entera de una vez. Además, ofrece "memoria persistente" para mantener la continuidad entre sesiones.
- Seguridad y límites: OpenAI se ha enfocado en mejorar la seguridad y reducir las "alucinaciones". GPT-5 está diseñado para ser "más honesto sobre sus limitaciones", indicando claramente cuándo no puede realizar una tarea o qué necesita para hacerlo. En lugar de rechazar solicitudes, ofrecerá "respuestas seguras", explicando por qué no puede ayudar y remitiendo al usuario a otras fuentes o manuales.
- Integración con Google: Para los suscriptores Pro, Plus y Team, GPT-5 puede conectarse con cuentas de Google para acceder a Gmail y Google Calendar, obteniendo así más contexto del usuario.
- Modo de voz: El modo de voz ha sido actualizado para sonar "mucho más natural" y está disponible para todos los usuarios. Permite respuestas altamente específicas, incluso resúmenes de una sola palabra.
- Personalización: Los usuarios de pago pueden personalizar la apariencia de la interfaz de ChatGPT e incluso "ajustar ligeramente la personalidad de GPT-5" para casos de uso en investigación.
Disponibilidad y versiones
GPT-5 se está desplegando para todos los usuarios de ChatGPT de forma inmediata, incluidos los de la versión gratuita. Los suscriptores de pago (Plus, Pro, Team) tendrán límites de uso más altos y acceso a versiones más avanzadas.
OpenAI ha lanzado cuatro versiones especializadas de GPT-5, adaptadas para distintos usos:
- Standard (gpt-5): Diseñado para tareas lógicas de alto nivel y procesos de múltiples pasos.
- Mini (gpt-5-mini): Versión más ligera que requiere menos recursos, ideal para eficiencia de costos y ejecución en dispositivos. Los usuarios gratuitos serán asignados frecuentemente a esta versión una vez agotados sus créditos principales.
- Nano (gpt-5-nano): Optimizado para velocidad y baja latencia. Probablemente es una versión destilada del modelo Mini.
- Chat (gpt-5-chat / chatb5 chat latest): Optimizado para conversaciones avanzadas, contextuales y multimodales, especialmente en aplicaciones empresariales.
Estas versiones están disponibles desde el primer día a través de la API y GitHub Models para desarrolladores.
Rendimiento y eficiencia de costos
Aunque la presentación tuvo momentos "incómodos", incluyendo una diapositiva de benchmarks muy criticada donde un 52% se mostraba como mayor que un 69%, GPT-5 ha sido presentado como un modelo que "marca un nuevo estándar en varios benchmarks", incluyendo SWE-Bench. No obstante, críticos como Graham Newbrigg (CMU) señalan que OpenAI no evaluó en todos los casos del benchmark Swebench, lo que podría inflar los resultados. De manera similar, en el reto ARC, GPT-5 queda por detrás de Grok 4 en algunas áreas, a pesar de ser más económico.
Uno de los aspectos más llamativos y menos publicitados es la gran reducción de costos y el aumento de velocidad. El modelo principal cuesta $1.25 por millón de tokens de entrada y $10 por millón de tokens de salida, mucho más barato que modelos como Claude Opus o Sonnet. Los modelos Mini y Nano son aún más accesibles: Mini cuesta $0.25 de entrada y $2 de salida por millón de tokens, y Nano tan solo $0.05 de entrada y $0.40 de salida. Esta estructura de precios competitiva, especialmente para Mini y Nano, hace que muchos modelos GPT-4 resulten "irrelevantes" en comparación con GPT-5 por su mejor desempeño y menor costo. Las mejoras en velocidad beneficiarán especialmente a las aplicaciones de programación y tareas agénticas, donde los tiempos de espera son una gran frustración.
Impresiones iniciales y perspectivas
Aunque Sam Altman describió la experiencia de usar GPT-5 como "hablar con un experto", algunas impresiones iniciales sugieren que no tiene el mismo "factor sorpresa" que GPT-4 tuvo en su momento. También hay preocupación sobre posibles frustraciones de los usuarios con el sistema de enrutamiento, especialmente para quienes pagan y esperan que se use siempre un modelo de razonamiento. El límite de conocimiento de GPT-5 es de octubre del año pasado, y es aún anterior para el modelo Mini, lo que indica que su preentrenamiento se realizó con cierta antelación.
A pesar de estas observaciones, GPT-5 representa un cambio claro hacia un ecosistema de IA eficiente, especializado y altamente capaz. Su enfoque en tareas agénticas, sus capacidades mejoradas en programación y escritura, y su manejo más responsable de temas sensibles como la salud, combinado con una drástica reducción de costos, lo posicionan como una herramienta poderosa para una amplia gama de aplicaciones. Si logrará mantener el liderazgo dominante de GPT-4 está por verse, pero su impacto en la accesibilidad y aplicación práctica de la IA avanzada es innegable.