OpenAI lanzó GPT-5.3 Codex el 5 de febrero de 2026 y en ese momento cambió las reglas del agentic coding. No es solo un modelo que sugiere código — es un agente que puede cargar un monorepo de producción completo en contexto, ejecutar el terminal, depurar bugs y correr flujos de trabajo enteros mientras tú haces otra cosa.
Como ingeniero informático que lleva meses probando herramientas de codificación agentica (Claude Code, Antigravity 2.0 de Google y Codex), aquí tienes el análisis honesto: qué funciona, qué no, y para quién vale la pena.
No tengo afiliación con OpenAI. Este análisis está basado en documentación oficial, benchmarks públicos y datos de precios verificados. Todos los números son de mayo 2026.
¿Qué es exactamente GPT-5.3 Codex?
La historia de Codex tiene dos capítulos. El primero: 2021, cuando OpenAI lanzó un modelo basado en GPT-3 entrenado con código. Era impresionante para la época pero básicamente un autocompletado sofisticado.
El segundo capítulo es el actual: desde abril de 2025, Codex es una plataforma agentica completa. GPT-5.3 Codex (anunciado el 5 de febrero de 2026) combina las capacidades de codificación de su antecesor con el razonamiento de GPT-5.2, resultando en un agente que no solo escribe código sino que ejecuta tareas completas de desarrollo de forma autónoma.
Capacidades técnicas verificadas
El dato más relevante para proyectos reales: 1 millón de tokens de contexto permite cargar una base de código de producción entera en una sola sesión. Eso elimina el problema clásico de los agentes de código que pierden contexto cuando el proyecto supera cierto tamaño.
Precios — estructura actualizada a mayo 2026
El 2 de abril de 2026, OpenAI cambió el modelo de facturación: de licencias fijas por asiento a precio por consumo de tokens. Esto cambia completamente el análisis de coste para equipos y empresas.
Planes de suscripción ChatGPT (acceso web)
Precios API (por consumo de tokens)
| Modelo | Input / millón tokens | Output / millón tokens | Mejor para |
|---|---|---|---|
| Codex Mini | $0.75 | $3.00 | Tareas simples, prototipado |
| GPT-5 Codex (turbo) | $1.25 | $10.00 | Producción, proyectos complejos |
| GPT-5.3 Codex (full) | $1.75 | $14.00 | Máximas capacidades agenticas |
Tres formas de acceder a Codex
OpenAI diseñó Codex para tres perfiles distintos, cada uno con su propio punto de entrada:
1. Desde ChatGPT (web/app) — para no programadores
La forma más accesible. Simplemente le pides a ChatGPT que construya, explique o depure código. No hace falta instalar nada ni configurar entornos. Las limitaciones: menos control sobre el entorno de ejecución, sin acceso al sistema de archivos local y límites de tokens según el plan.
2. CLI de Codex — para desarrolladores
La herramienta de línea de comandos permite integrar Codex directamente en el flujo de trabajo del terminal. Accede al sistema de archivos local, puede ejecutar comandos y tiene acceso a todo el contexto del proyecto. Es el equivalente directo a la CLI de Claude Code — y la comparación entre ambas es la más reñida del mercado developer ahora mismo.
3. API — para equipos y automatización
Para equipos que quieren automatizar tareas de codificación o integrar Codex en sus pipelines de CI/CD. Con el cambio a precios por token (abril 2026), ahora es mucho más predecible el coste para volúmenes altos.
Benchmarks y rendimiento real
| Característica | GPT-5.3 Codex | Claude Code (Opus 4.6) | Antigravity 2.0 |
|---|---|---|---|
| SWE-bench Verified | ~74% | 77.2% | En revisión |
| Velocidad (tokens/s) | 240+ | ~95 | N/D |
| Contexto máximo | 1M tokens | 200K tokens | 1M tokens |
| Eficiencia de tokens | 2-4x más eficiente | Base | N/D |
| App de escritorio | No (solo web/CLI/API) | No (solo CLI) | Sí |
| Agentes paralelos | No | No | Sí |
| Precio API (input/M) | $1.25 (turbo) | $3.00 (Sonnet) | Via Gemini 3.5 |
| Estabilidad del producto | Alta | Alta | Bugs en lanzamiento |
Pros y contras de GPT-5.3 Codex
- 1M tokens: carga monorepos enteros en una sesión
- 240 tokens/s — 2.5x más rápido que la competencia
- 2-4x más eficiente en uso de tokens para tareas equivalentes
- 3 formas de acceso según perfil (web, CLI, API)
- Cambio a precios por token: más predecible para equipos
- Ecosistema maduro: GPT Store, plugins, integraciones
- Debug y ejecución de terminal autónomos
- Precio API competitivo: $1.25/M tokens (turbo)
- SWE-bench (~74%) inferior a Claude Code (77.2%)
- Sin app de escritorio ni agentes paralelos como Antigravity
- Plan Pro a $200/mes — caro si solo necesitas codificación
- La API requiere gestión de costes (con 1M tokens se acumula)
- Razonamiento en tareas no técnicas inferior a Claude Opus
- Sin integración nativa con Google Workspace (si usas ese ecosistema)
Puntuación de Codex GPT-5.3
¿Para quién es Codex? — Quiz interactivo
Antes de pagar por Codex, asegúrate de que es la herramienta que necesitas. Este quiz te dice en 4 preguntas si Codex, Claude Code o Antigravity 2.0 encaja mejor con tu perfil.
FAQ — Preguntas frecuentes sobre ChatGPT Codex
GPT-5.3 Codex es un agente autónomo de codificación, no un chatbot que responde preguntas. Puede cargar tu proyecto entero (hasta 1M de tokens), ejecutar comandos en el terminal, detectar y corregir bugs de forma autónoma, y completar flujos de trabajo de desarrollo sin que tengas que intervenir en cada paso. La diferencia práctica: no le pides "escribe esta función" — le dices "implementa esta feature" y lo hace solo.
Sí, el modelo cambió el 2 de abril de 2026. OpenAI pasó de licencias fijas a precios por consumo de tokens. La API de GPT-5 Codex (turbo) cuesta $1.25 de entrada y $10 de salida por millón de tokens. Para acceso vía ChatGPT, los planes van de gratis (Free) a $200/mes (Pro). El plan Plus ($20/mes) incluye Codex con límites. Más detalles en el análisis de precios comparativo con Claude y Gemini en este artículo.
Depende del criterio. Claude Code (Opus 4.6) gana en SWE-bench (77.2% vs ~74% de Codex) — mejor en la calidad del código generado para problemas complejos. Codex gana en velocidad (240+ tokens/s vs ~95 de Claude) y en contexto (1M vs 200K tokens). Si tienes monorepos grandes y la velocidad importa, Codex. Si priorizas que el código sea correcto en tareas complejas, Claude Code. Ambos son producción-ready.
La CLI de Codex requiere Node.js instalado y se instala con npm. Sí necesitas conocimientos técnicos básicos — saber usar la terminal y gestionar variables de entorno para la API key. Para usuarios sin experiencia técnica, la interfaz web de ChatGPT (chatgpt.com) es mucho más accesible y permite usar Codex sin instalar nada.
Depende de cuánto código generas. Si usas Codex como herramienta principal de desarrollo y trabajas en proyectos grandes, el plan Pro ($200/mes) puede ser rentable versus la API (donde $200 compran unos 160M tokens de entrada a precio turbo). El Business plan ($25-30/usuario/mes) es más económico para equipos. Si solo lo usas ocasionalmente, el Plus ($20/mes) con límites suele ser suficiente.
Para proyectos grandes: sí, claramente. El contexto de 1M tokens y la velocidad de 240 tokens/s son ventajas reales en monorepos. Si tienes una base de código grande y necesitas un agente que la entienda completa, Codex es la primera opción por delante de Claude Code hoy.
Para calidad de código en tareas complejas: Claude Code (Opus 4.6) sigue siendo ligeramente mejor en SWE-bench. La diferencia es pequeña (77.2% vs ~74%) pero existe. Si la corrección del código generado es crítica para ti, Claude Code tiene una leve ventaja.
Para el ecosistema Google: Antigravity 2.0 va a ser una alternativa seria en 6-8 semanas cuando corrijan los bugs del lanzamiento. Hoy mismo, si usas Google Workspace, tiene ventajas de integración que Codex no puede igualar.
La comparativa completa de las tres plataformas (Google, OpenAI, Anthropic) con tablas de precios, benchmarks de LLMs y próximos lanzamientos la tienes en Google vs ChatGPT vs Claude 2026.
