GPT-5.5 Llega A ChatGPT Y Codex

4/24/2026

OpenAI presentó GPT-5.5 el 23 de abril de 2026 y lo definió como una nueva clase de inteligencia para el trabajo real. La compañía afirma que el modelo entiende antes lo que el usuario intenta hacer, usa herramientas con más eficacia, revisa su propio trabajo y mantiene la tarea en marcha hasta completarla. En la práctica, GPT-5.5 se presenta como un modelo pensado para trabajos que combinan programación, investigación en línea, análisis de datos, documentos, hojas de cálculo, uso de software y movimiento entre distintas herramientas. La idea central del anuncio es que el usuario pueda delegar tareas desordenadas y de varias partes sin tener que dirigir cada paso.

Introducing GPT-5.5

A new class of intelligence for real work and powering agents, built to understand complex goals, use tools, check its work, and carry more tasks through to completion. It marks a new way of getting computer work done.

Now available in ChatGPT and Codex. pic.twitter.com/rPLTk99ZH5
— OpenAI (@OpenAI) April 23, 2026

Uno de los focos principales es la programación agentic. OpenAI sostiene que GPT-5.5 es su modelo más fuerte hasta ahora para este tipo de trabajo. En Terminal-Bench 2.0, una evaluación de flujos complejos de línea de comandos que requieren planificación, iteración y coordinación de herramientas, alcanzó 82,7% de precisión. En SWE-Bench Pro, centrado en la resolución de incidencias reales de GitHub, llegó al 58,6%. También superó a GPT-5.4 en Expert-SWE, una evaluación interna de OpenAI para tareas de programación de largo recorrido con una mediana estimada de 20 horas de trabajo humano. En Codex, el modelo se orienta a tareas como implementación, refactorización, depuración, pruebas y validación. https://pbs.twimg.com/media/HGm8jVWbsAAwL60?format=png&name=900x900 OpenAI relaciona estas mejoras con comportamientos propios del trabajo de ingeniería real. Según el comunicado, GPT-5.5 mantiene mejor el contexto en sistemas grandes, razona sobre fallos ambiguos, usa herramientas para comprobar supuestos y extiende los cambios al resto del código afectado. La compañía también indica que el modelo mejora los resultados de GPT-5.4 en las tres evaluaciones de programación y, al mismo tiempo, usa menos tokens. Esa eficiencia forma parte del mensaje general del lanzamiento: OpenAI afirma que GPT-5.5 iguala la latencia por token de GPT-5.4 en servicio real, mientras opera a un nivel superior de inteligencia. El modelo también se presenta como una herramienta para el trabajo diario de conocimiento en ordenador. OpenAI dice que GPT-5.5 avanza de forma más natural por el ciclo completo de buscar información, comprender qué importa, usar herramientas, revisar el resultado y convertir material bruto en un entregable útil. En las tablas publicadas, GPT-5.5 obtuvo 84,9% en GDPval, 78,7% en OSWorld-Verified y 98,0% en Tau2-bench Telecom sin ajuste de prompts. También registró 60,0% en FinanceAgent, 88,5% en tareas internas de modelización de banca de inversión y 54,1% en OfficeQA Pro. En Codex, OpenAI afirma que GPT-5.5 supera a GPT-5.4 en la generación de documentos, hojas de cálculo y presentaciones. GPT-5.5 Pro se sitúa como la opción para tareas más difíciles y de mayor precisión en ChatGPT. OpenAI señala que los primeros usuarios de prueba encontraron sus respuestas más completas, mejor estructuradas, más precisas, relevantes y útiles que las de GPT-5.4 Pro, con comentarios especialmente positivos en negocios, derecho, educación y ciencia de datos. GPT-5.5 Thinking está llegando a usuarios Plus, Pro, Business y Enterprise en ChatGPT. GPT-5.5 Pro se despliega para Pro, Business y Enterprise. En Codex, GPT-5.5 está disponible para los planes Plus, Pro, Business, Enterprise, Edu y Go con una ventana de contexto de 400K. También se ofrece Fast mode, con generación de tokens 1,5 veces más rápida a 2,5 veces el coste. La investigación científica y técnica ocupa otro bloque importante del anuncio. OpenAI dice que GPT-5.5 mejora en flujos donde no basta con responder una pregunta difícil, sino que hay que explorar una idea, reunir evidencia, probar supuestos, interpretar resultados y decidir el siguiente paso. La empresa reporta una mejora clara frente a GPT-5.4 en GeneBench, una evaluación centrada en análisis científico de varias etapas en genética y biología cuantitativa. En BixBench, orientado a bioinformática y análisis de datos del mundo real, OpenAI afirma que GPT-5.5 obtuvo rendimiento destacado entre los modelos con resultados publicados. El comunicado también menciona una versión interna de GPT-5.5 con un harness personalizado que ayudó a descubrir una nueva demostración relacionada con números de Ramsey, después verificada en Lean. OpenAI también pone el acento en seguridad y despliegue gradual. La compañía afirma que GPT-5.5 fue evaluado mediante sus marcos de seguridad y preparación, con pruebas internas y externas de red-team y evaluaciones específicas para capacidades avanzadas de ciberseguridad y biología. OpenAI indica que trata las capacidades biológicas, químicas y de ciberseguridad de GPT-5.5 como High dentro de su Preparedness Framework, aunque aclara que el modelo no alcanzó el nivel Critical en ciberseguridad. La API todavía no está disponible, pero la compañía dice que GPT-5.5 y GPT-5.5 Pro llegarán pronto. La tarifa prevista para gpt-5.5 es de 5 dólares por 1 millón de tokens de entrada y 30 dólares por 1 millón de tokens de salida; gpt-5.5-pro tendrá un precio previsto de 30 y 180 dólares, respectivamente.