De 5% a 40% en 4 meses: la guerra entre Claude Code y Codex que nadie te estaba contando

En septiembre de 2025, el uso de Codex representaba aproximadamente el 5% del uso de Claude Code. Para enero de 2026, esa cifra había escalado a cerca del 40%. Cuatro meses. Un crecimiento de 8x relativo. Y casi nadie en la comunidad general estaba prestando atención.

No hubo un gran anuncio. No hubo un evento de lanzamiento viral. Fue WIRED quien reportó los números en marzo de 2026, y aún así el debate no explotó hasta que los datos de GitHub empezaron a circular.

Esos datos eran difíciles de ignorar: Claude Code estaba firmando aproximadamente el 4% de todos los commits públicos de GitHub, unos 135.000 por día, llegando a un pico de 326.000 commits en un solo día el 15 de marzo de 2026. No era un benchmark. No era un demo. Era el rastro real de código que una herramienta estaba dejando en la infraestructura de software del mundo.

Esta es la historia de lo que realmente está pasando en la guerra de los agentes de coding — con los datos que importan, las jugadas estratégicas que se hicieron y la pregunta práctica que cada developer debería estar haciéndose hoy.

Primero: qué son estos dos productos en 2026

Antes de los números, hay que aclarar algo que la mayoría de comparativas omite: Claude Code y Codex no son lo mismo disfrazado. Son apuestas arquitectónicas diferentes sobre qué debe ser un agente de coding.

Claude Code es el agente de Anthropic, nativo de terminal, lanzado en mayo de 2025. Opera desde la línea de comandos del developer, lee el contexto del proyecto desde un archivo CLAUDE.md, y puede razonar sobre codebases completas usando la ventana de contexto de 1 millón de tokens de Claude Opus. Su filosofía es mantenerte en el loop mientras la tarea corre. Tú ves el progreso. Puedes intervenir. El agente trabaja con tu codebase real, en tu máquina, con tus credenciales.

Codex (el de 2026, no el modelo de 2021 que impulsó a Copilot) es la apuesta de OpenAI por el modelo opuesto. Es un entorno agéntico nativo de la nube, embebido dentro de ChatGPT, que levanta containers aislados por tarea y está optimizado para delegación asíncrona de tipo "fire and forget". Tú defines la tarea, la mandas, y revisas el branch más tarde. El agente trabaja en una sandbox en la nube sin acceso a tu máquina.

Esa diferencia no es estética. Define qué tipo de workflows gana cada herramienta, cuánto cuestan en tokens, y qué riesgos de seguridad presenta cada una.

La cronología de una guerra que se aceleró en abril

Para entender el estado actual del mercado, hay que seguir la línea de tiempo. Porque lo que pasó entre marzo y mayo de 2026 no fue una evolución gradual. Fue una secuencia de jugadas estratégicas explícitas.

Febrero 2026: Claude Code alcanza más de $2.5 mil millones en revenue anualizado. Cursor, su rival en el segmento de IDE, supera los $2 mil millones, convirtiéndose según varios reportes en el SaaS de más rápido crecimiento jamás registrado. El mercado de agentes de coding está generando dinero real.

Marzo 2026: Codex supera los 3 millones de usuarios activos semanales, subiendo desde 2 millones el mes anterior. La curva de crecimiento es vertical. Y los datos de commits de GitHub empiezan a circular en X y Hacker News, poniendo el nombre de Claude Code en todas las conversaciones.

9 de abril 2026: OpenAI lanza su nuevo tier Pro a $100 al mes. El movimiento de precios no es neutral — es la señal de que los workflows agénticos están consumiendo tokens a una escala que los planes de $20 no pueden absorber.

21 de abril 2026: Anthropic retira Claude Code del plan Pro de $20. Un día después, GitHub congela nuevos registros para Copilot Pro. Tres semanas. Cuatro movimientos coordinados entre los mayores jugadores del mercado. El equilibrio de precios que había durado meses se rompe en menos de un mes.

La contraofensiva: OpenAI comienza a ofrecer acceso gratuito a Codex a desarrolladores suscriptores de Claude Code. El mensaje es explícito: prueba nuestro agente, a nuestra cuenta. No es una campaña de marketing sutil — es una jugada de adquisición directa apuntada a la base de usuarios de un competidor específico. Anthropic responde aumentando los límites de uso de Claude Code en un 50% sin cambiar el precio.

Esto no es competencia de producto. Es guerra de trincheras por la base instalada.

Los números que importan: benchmarks reales, no marketing

El debate sobre "cuál es mejor" en la comunidad de developers tiende a naufragar rápido en opiniones anecdóticas. Hay datos concretos que vale la pena conocer.

En SWE-bench Pro — el benchmark más respetado del sector porque usa issues reales de GitHub y es difícil de contaminar — Claude Opus 4.8 lidera con 69.2% versus 58.6% de GPT-5.5. Una diferencia de más de 10 puntos porcentuales en el benchmark que mejor mide la capacidad de resolver problemas reales de código no es ruido estadístico.

En Terminal-Bench 2.1 — que mide a un agente conduciendo una terminal real para completar tareas de desarrollo — Codex CLI con GPT-5.5 lidera con 83.4%, y Claude Code con Opus 4.8 queda segundo con 78.9%. Codex gana en velocidad de ejecución terminal. Claude Code gana en profundidad de razonamiento sobre código complejo.

En satisfacción de desarrolladores: La encuesta de Pragmatic Engineer de febrero de 2026 entre 906 ingenieros de software profesionales ubicó a Claude Code con el rating más alto de "herramienta que pelearía por conservar", con un 46%. Ningún otro agente de coding superó el 25%.

En costo real por tarea: Un refactor documentado de Express.js costó aproximadamente $15 con Codex versus aproximadamente $155 con Claude Code, mientras que revisores ciegos prefirieron el output de Claude Code en el 67% de los casos. Codex es considerablemente más barato por tarea. Claude Code produce output de mayor calidad percibida. Esa matemática define el caso de uso de cada herramienta.

La arquitectura de subagentes: donde se abre la brecha real

El debate de benchmarks es útil pero incompleto. La diferencia más importante entre las dos herramientas en 2026 no está en los scores — está en cómo manejan el trabajo paralelo.

Codex lanzó subagentes en disponibilidad general en marzo de 2026, con hasta 8 agentes paralelos trabajando simultáneamente. Claude Code respondió con Agent Teams: múltiples sub-agentes que comparten una lista de tareas con tracking de dependencias y pueden enviarse mensajes entre sí directamente, cada uno trabajando en un git worktree aislado.

La diferencia arquitectónica es concreta: Codex usa un modelo de manager-worker aislado — el agente principal delega a workers independientes que no se comunican entre sí. Claude Code usa coordinación activa — los sub-agentes comparten contexto, se mensajean, y pueden resolver dependencias entre sus tareas en tiempo real.

Para tareas masivamente paralelas e independientes (revisar 50 PRs, generar tests para 30 funciones), la arquitectura de Codex es más eficiente. Para tareas que requieren coordinación profunda (refactorizar una arquitectura donde los cambios en un módulo afectan a otros), la arquitectura de Claude Code produce resultados más coherentes.

En mayo de 2026, Claude Code añadió el dashboard "claude agents" (v2.1.139) para gestionar todas las sesiones, y el comando /goal para trabajo persistente hasta que se cumpla una condición de completación.

El stack que los mejores equipos usan hoy

La narrativa de "elige uno" es conveniente para el marketing pero no refleja cómo trabajan los equipos más productivos. La realidad que surge de múltiples análisis de 2026 es que la pregunta dejó de ser Claude Code vs Codex hace meses.

La configuración típica en equipos maduros combina Claude Code en la terminal para trabajo agéntico profundo, Copilot o Cursor dentro del IDE para autocompletado e inline edits, y una interfaz de chat para pensar la arquitectura.

La mayoría de las organizaciones de ingeniería maduras terminan corriendo ambas: Claude Code como builder principal dentro del codebase, Codex como revisor asíncrono y punto de entrada para desarrolladores no-senior.

Para developers independientes y vibe coders, el stack de referencia que circula en la comunidad es: Claude Code para trabajo arquitectónico pesado (el único que permite de forma segura que una IA reescriba 40 archivos simultáneamente con coherencia), Codex cuando necesitas paralelismo masivo y el presupuesto de tokens importa, y Cursor para las sesiones de revisión manual.

El costo total de ese stack en uso intensivo: aproximadamente $1.000 por mes por developer. Para ingenieros que facturan $150 o más por hora, el período de retorno de esa inversión es típicamente menos de una semana.

El tercer jugador que nadie esperaba

En cualquier análisis honesto de 2026, hay un nombre que no puede ignorarse: OpenCode.

Lanzado en junio de 2025, OpenCode alcanzó 160.000+ estrellas en GitHub en menos de un año y 7.5 millones de desarrolladores activos mensuales, con más de 900 contribuidores. Lo hizo sin equipo de marketing, sin producto de suscripción, y sin lock-in de IDE. Los developers lo encontraron y se lo dijeron unos a otros.

Para contexto: VS Code tiene 185.000 estrellas acumuladas desde que Microsoft lo hizo open source en noviembre de 2015. OpenCode hizo casi lo mismo en once meses.

La arquitectura es un setup persistente cliente/servidor. Un servidor en background maneja la comunicación con la IA y el estado de sesión en una base de datos SQLite local. El frontend — TUI de terminal, app de escritorio, o extensión de IDE — simplemente se conecta a él. Las sesiones sobreviven desconexiones SSH y cierres de terminal: si te reconectas, el servidor sigue corriendo, en medio de la tarea. Eso es arquitectónicamente diferente a Claude Code, que sale cuando cierras la terminal.

OpenCode no es un modelo — es infraestructura. Su score en cualquier benchmark es exactamente el del modelo que conectes: Opus 4.7 a través de OpenCode produce los mismos resultados que Claude Code; GPT-5.5 produce los mismos que Codex. Es el argumento más directo contra el lock-in de vendor en el mercado actual.

La guerra de precios y lo que revela sobre el mercado

El movimiento de precios de abril 2026 no fue un accidente ni una decisión aislada. Fue la respuesta a un cambio estructural en el consumo.

La causa no es un pico en costos de infraestructura, a pesar de lo que dicen los comunicados de prensa. Es que los workflows agénticos transformaron el consumo: un usuario promedio de 2024 hacía 50 llamadas al día, mientras que un usuario de 2026 con Claude Code o Codex agéntico corre miles. Sesiones paralelas, tareas en background, loops autónomos de horas. Los planes baratos no pueden absorber esos números.

El resultado es una estructura de precios que se estandarizó rápidamente en los tres grandes: OpenAI restructuró en abril 2026 con tiers a $8, $20, $100 (5x límites, GPT-5.5 Pro) y $200 (20x límites). Anthropic ofrece Pro ($20), Max 5x ($100) y Max 20x ($200). Google siguió la misma lógica con Google AI Pro a $19.99 y Google AI Ultra desde $99.99.

Tres empresas. La misma escalera de precios. La misma semana. Cuando eso pasa, no es coincidencia — es el mercado convergiendo en lo que los workflows agénticos realmente cuestan.

Para los que no quieren pagar $100 al mes, las alternativas open source están más fuertes que nunca: Cline con 58.200 estrellas en GitHub y 5 millones de instalaciones en VS Code; Aider con 39.000 estrellas y 4.1 millones de instalaciones, procesando 15 mil millones de tokens por semana. Gemini CLI de Google es open source bajo licencia Apache 2.0 con 1.000 requests gratuitas por día.

Lo que esto significa si estás construyendo productos hoy

Si eres un developer independiente, un vibe coder, o alguien construyendo SaaS sobre estos stacks, el panorama tiene implicaciones prácticas concretas.

El mercado de herramientas de coding con IA proyecta llegar a $91 mil millones para 2035, creciendo al 27.6% anual desde $7.9 mil millones en 2025. Ese tamaño garantiza múltiples ganadores. La pregunta no es qué herramienta "gana" — es cuál encaja mejor con tu workflow específico.

El patrón dominante en empresas en 2026 es: Copilot desplegado ampliamente como baseline de autocompletado para todos los ingenieros, más Claude Code adoptado desde abajo hacia arriba por ingenieros senior para trabajo agéntico de alto impacto.

Para elegir entre Claude Code y Codex, la decisión práctica se reduce a dos variables:

¿Necesitas coordinar cambios complejos que afectan múltiples partes del codebase? Claude Code. La arquitectura de Agent Teams con mensajería entre sub-agentes y worktrees aislados produce coherencia que Codex no puede igualar en tareas de alta interdependencia.

¿Necesitas ejecutar muchas tareas independientes en paralelo con presupuesto ajustado de tokens? Codex. La diferencia de costo por tarea ($15 vs $155 en el refactor documentado) es real y se acumula.

SemiAnalysis proyecta que Claude Code superará el 20% de todos los commits diarios de GitHub para finales de 2026. Si esa proyección se cumple, una de cada cinco líneas de código que se publican en el repositorio de software más grande del mundo habrá sido escrita por un agente de Anthropic. No es el futuro. Es la dirección que los datos ya están indicando.

Lo que los números realmente dicen

135.000 commits por día. Un pico de 326.000 en una sola jornada. $2.5 mil millones en revenue anualizado. 3 millones de usuarios activos semanales para Codex. 160.000 estrellas en GitHub para OpenCode en menos de un año.

Estos no son métricas de adopción de una nueva feature. Son las métricas de un cambio en cómo se escribe software a escala global.

La "guerra" entre Claude Code y Codex es real, pero el framing de guerra oscurece algo más importante: el mercado ya decidió que los agentes de coding no son opcionales. La pregunta dejó de ser si adoptarlos. Ahora es qué combinación usar, para qué tipo de tarea, con qué presupuesto de tokens.

El developer que entiende esa distinción no está eligiendo un bando. Está construyendo el stack que le da la ventaja real.

Buscar en este blog

EL JUBILADO INFORMATICO