Tras meses de expectativa y muchos rumores, finalmente OpenAI presentó oficialmente GPT-5, su modelo de inteligencia artificial más avanzado hasta la fecha y con el que busca reafirmar su liderazgo en el sector. Se trata de un modelo que no solo mejora a sus predecesores, sino que cambia en varios aspectos la forma de interacción entre el ser humano y la IA.
El nuevo GPT-5 ya está disponible para todos los usuarios de ChatGPT, tanto gratuitos como de pago, y para desarrolladores a través de API. La mayor novedad de este nuevo modelo está en sus capacidades multimodales, el razonamiento estructurado y la memoria persistente en una sola arquitectura.
Esto significa que GPT-5 puede entender y generar texto, imágenes, audio y video dentro de una misma conversación. Sam Altman, CEO de OpenAI, ha señalado que la experiencia con GPT-5 es comparable a la de “conversar con un experto con doctorado en cualquier materia”. Esta integración multimodal elimina la necesidad de usar herramientas separadas para distintas tareas.
De otro lado, su ventana de contexto, es decir, la forma cómo busca, analiza y optimiza datos para luego responder, ha sido ampliada a un millón de tokens, frente a los 128.000 tokens de base en ChatGPT-4o , lo que le permite procesar grandes volúmenes de información de manera más eficiente. Solo para que tenga una base: 32.000 tokens equivalen a 50 páginas de texto generativo.
Lo primero es su intento de ordenar y consolidar en cuatro versiones la oferta del modelo: GPT-5, para tareas lógicas de alto nivel; GPT-5 Mini, enfocado en la eficiencia de costos; GPT-5 Nano, priorizando la velocidad y baja latencia, y GPT-5 Chat, optimizado para conversaciones contextuales y entornos empresariales.
Lo otro es que el modelo está diseñado para funcionar como un agente autónomo, lo que significa que puede ejecutar tareas complejas con mínima supervisión humana, como generar software, preparar informes, organizar la agenda, citas, leer y responder correos, etc., lo que lo acerca a la visión de una IA General que no solo responde, sino que también actúa de manera proactiva.
La memoria persistente es otra de sus novedades. El modelo puede recordar conversaciones pasadas y adaptarse a objetivos a largo plazo, lo que permite una interacción más coherente y personalizada a lo largo del tiempo, pues podrá “recordar” y por tanto “aprender” mejor del uso diario, lo que lo hará “más humano”.
Por esto, por ejemplo, podrá ayudarle a estudiar una materia durante semanas, recordando avances y adaptando el contenido. De otro lado, el razonamiento estructurado del modelo ofrece respuestas más precisas y coherentes.
A diferencia de las versiones anteriores, GPT-5 puede anticipar y explicar sus decisiones, reduciendo las alucinaciones, los errores y proporcionando resultados más fiables.
Otra buena noticia es que, dada la dura competencia con Google, Meta y Anthropic, Open AI anunció junto con ChatGPT-5 dos nuevos modelos de IA generativa gratuitos, gpt-oss-120b y gpt-oss-20b, que los usuarios pueden personalizar y es un sano regreso de la empresa a sus raíces de código abierto para ciertos productos.
Uno de los cambios más criticados fue la eliminación del selector de modelos, una herramienta crucial para los usuarios avanzados que personalizaban sus flujos de trabajo eligiendo entre distintas versiones de la IA. Este cambio generó gran malestar entre la comunidad, que vio frustrada su capacidad de control y personalización.
Si bien para la gran mayoría de usuarios del modelo no será esto un problema, pues prácticamente nunca usaron otros modelos ni intercambiaron alguno según sus necesidades, para los más avanzados y corporativos esto sí es un tema importante, por el que además pagan para tener acceso.
La compañía finalmente atendió a las quejas y volvió a ofrecer el árbol de modelos anteriores para los usuarios pagos.