El gobierno de EE.UU. apagó el modelo de IA más poderoso del mundo a las 5:21 PM — y lo que pasó después cambió la industria para siempre

El 9 de junio de 2026, Anthropic lanzó Claude Fable 5 — el modelo de IA más capaz disponible para el público en la historia de la empresa, y según los benchmarks de Vals AI, el modelo más capaz disponible para cualquier persona en el mundo en ese momento.

Tres días después, a las 5:21 PM del viernes 12 de junio, el gobierno de los Estados Unidos le envió una carta a Anthropic.

El Departamento de Comercio de EE.UU., citando autoridades de seguridad nacional, emitió una directiva de control de exportaciones para suspender todo acceso a Fable 5 y Mythos 5 por parte de cualquier nacional extranjero, ya sea dentro o fuera de los Estados Unidos, incluyendo a empleados extranjeros de Anthropic.

Anthropic no tenía forma práctica de filtrar el acceso por nacionalidad en tiempo real en una base de usuarios de cientos de millones de personas. Así que hizo lo único técnicamente posible: apagó ambos modelos para todos, en todos lados, esa misma noche.

Fue la primera vez en la historia que el gobierno de EE.UU. forzó la suspensión de un modelo de IA comercial desplegado a escala masiva. Y el motivo oficial — un jailbreak — abrió uno de los debates más importantes que la industria tecnológica ha tenido en décadas.


La cronología: 72 horas que cambiaron todo

Para entender lo que pasó, hay que seguir la línea de tiempo con precisión.

Lunes 9 de junio, 2026: Anthropic lanza Claude Fable 5 públicamente. Inmediatamente se convierte en el modelo de IA más capaz disponible para el público, según los benchmarks de Vals AI. Fable 5 era la versión del modelo Mythos diseñada para uso comercial general — el mismo modelo subyacente, pero con guardrails adicionales que bloqueaban respuestas en áreas de alto riesgo como ciberseguridad y biología.

Dentro de las primeras 48 horas: Un investigador usando el pseudónimo "Pliny the Liberator" publicó lo que identificó como el system prompt completo de Fable 5 en X y GitHub. El system prompt es un conjunto oculto de instrucciones que ayuda a determinar el comportamiento de un modelo de IA. El ecosistema de jailbreakers — lo que algunos investigadores llaman "el Undersphere" — empieza a trabajar.

Viernes 12 de junio, 5:21 PM ET: Anthropic recibe la directiva del gobierno. La carta no proporcionó detalles específicos sobre su preocupación de seguridad nacional.

Viernes 12 de junio, horas después: Anthropic apaga Fable 5 y Mythos 5 globalmente. Cualquier developer, empresa o usuario que había construido workflows sobre estos modelos se despertó el sábado con un sistema que ya no funcionaba.

Sábado 13 de junio: David Sacks, asesor de IA de la Casa Blanca, publica su versión en X: "Un socio de confianza altamente creíble tanto de Anthropic como del gobierno de EE.UU. que estaba probando Fable encontró un jailbreak de esos guardrails."

30 de junio: El Departamento de Comercio levanta los controles de exportación. Fable 5 regresa a los usuarios el 1 de julio en Claude.ai, Claude Platform, Claude Code y Claude Cowork.

Diecinueve días. Ese fue el tiempo que el gobierno de EE.UU. mantuvo apagado el modelo de IA más avanzado del mundo.


El jailbreak: qué era realmente y por qué importa la diferencia

El término "jailbreak" en los titulares sugiere algo dramático — un exploit técnico sofisticado que deshabilita todos los mecanismos de seguridad de un modelo. La realidad del jailbreak que desencadenó el apagado es considerablemente más matizada, y Anthropic la describió con precisión deliberada.

Nuestra comprensión es que el gobierno cree que se ha dado cuenta de un método para bypasear, o "jailbreak", Fable 5. Revisamos una demostración de esta técnica específica siendo usada para identificar un pequeño número de vulnerabilidades previamente conocidas y menores. Estas vulnerabilidades parecen ser todas relativamente simples, y hemos encontrado que otros modelos disponibles públicamente son capaces de descubrirlas también sin jailbreak.

Traducido: el jailbreak no era un exploit que convertía a Fable 5 en una máquina de ataques irrestricta. Era una técnica que permitía pedirle al modelo que leyera un codebase específico y encontrara fallas de software — una capacidad que, según Anthropic, ya existía en otros modelos públicos como GPT-5.5 sin necesidad de ningún jailbreak.

El gobierno ha dado a Anthropic solo evidencia verbal de un potencial jailbreak estrecho y no universal, que esencialmente consiste en pedirle al modelo que lea un codebase específico y corrija cualquier falla de software.

Hay un detalle técnico importante aquí que los titulares generalmente omitieron: Anthropic distingue entre jailbreaks universales — que pueden bypasear ampliamente todos los guardrails del modelo — y jailbreaks estrechos — que pueden elicitar algunas capacidades específicas en circunstancias particulares. Ningún tester ha podido encontrar todavía un jailbreak universal. Sospechamos que la resistencia perfecta a jailbreaks no es posible actualmente para ningún proveedor de modelos.

El gobierno actuó sobre un jailbreak estrecho. Anthropic argumentó que ese estándar, aplicado consistentemente, detendría todos los lanzamientos de modelos frontier en toda la industria.


Amazon, el inversor que alertó al gobierno

La identidad del "socio de confianza" que señaló el jailbreak no ha sido confirmada oficialmente, pero reportes del Wall Street Journal apuntan a Amazon.

El detalle es notable por una razón que va más allá de la política corporativa: Amazon es simultáneamente uno de los mayores inversores de Anthropic y uno de sus competidores más directos a través de Amazon Bedrock y Amazon Q Developer. Sus investigadores encontraron el jailbreak. Sus ejecutivos, incluyendo el CEO Andy Jassy, alertaron a funcionarios del gobierno.

"No es inusual que los gobiernos busquen nuestro consejo sobre posibles riesgos de seguridad", dijo un portavoz de Amazon a Semafor, declinando compartir detalles específicos.

La estructura de incentivos es, al menos, compleja. Una empresa que compite con Anthropic en el mercado de IA encontró una vulnerabilidad en el producto más avanzado de su competidor y la reportó al gobierno antes de dársela a Anthropic para que la corrigiera. El resultado fue un apagado de 19 días del modelo más avanzado disponible al público.


La trampa que Anthropic construyó para sí misma

Sam Altman, CEO de OpenAI, lo había dicho en abril — dos meses antes del apagado. En un podcast con Ashlee Vance, describió la comunicación pública de Anthropic sobre Mythos con una claridad brutal:

"Es claramente un marketing increíble decir, 'Hemos construido una bomba. Estábamos a punto de lanzarla sobre tu cabeza. Te venderemos un refugio antiaéreo por $100 millones.'"

Altman no predijo el apagado gubernamental. Pero identificó algo que se volvió profético: cuando una empresa pasa meses diciéndole al mundo que su IA es uniquamente peligrosa, el mundo — incluido el gobierno de EE.UU. — tiende a escuchar.

Anthropic había apostado gran parte de su identidad pública a ser la alternativa consciente de la seguridad frente a sus rivales. Mythos había sido presentado en abril con advertencias explícitas sobre su capacidad para encontrar vulnerabilidades de software. Cuando lo anunció originalmente, la compañía dijo que era demasiado bueno hackeando como para lanzarlo de inmediato. En cambio, Mythos fue puesto a disposición de un puñado de organizaciones (principalmente corporaciones tecnológicas de EE.UU.) para usar en parchear debilidades en sistemas digitales esenciales.

Fable 5 era la respuesta a la presión comercial obvia: una versión de Mythos con guardrails que bloqueaban respuestas en áreas de alto riesgo, haciéndola suficientemente segura para lanzamiento general. El problema es que tres días después del lanzamiento, el gobierno decidió que los guardrails no eran suficientes.

TechCrunch lo formuló sin rodeos en su titular: "Las advertencias de seguridad de Anthropic puede que acaban de salirles por la culata."


El contexto político: una guerra que empezó en febrero

El apagado de Fable 5 no ocurrió en el vacío. El gobierno de Trump en febrero ordenó a todas las agencias federales dejar de usar los modelos de Anthropic después de que la compañía se negó a aceptar los términos de contrato preferidos del Pentágono para vendors de IA, que estipulaban que cualquier modelo de IA comprado podría usarse "para cualquier propósito legal."

Anthropic había estado buscando exenciones para evitar que sus modelos fueran usados para sistemas de armas autónomos o vigilancia doméstica masiva. El Pentágono declaró a Anthropic un "riesgo de cadena de suministro" en marzo, requiriendo que el ejército de EE.UU. dejara de usar sus modelos y prohibiendo a contratistas de defensa usarlos para contratos gubernamentales. Anthropic está impugnando esa designación en corte federal.

Hay también reportes de que la Casa Blanca actuó parcialmente por sospecha de que un grupo vinculado a China había accedido a Mythos, generando temores de que el modelo podría ser reverse-engineered o destilado por un adversario extranjero.

El apagado de Fable 5, en ese contexto, no es solo una historia de regulación de IA. Es el capítulo más reciente de un conflicto en escalada entre una empresa que construyó su identidad sobre la seguridad y una administración que interpreta esa misma posición como un obstáculo.


La resolución y lo que Anthropic tuvo que conceder

El 30 de junio, el Departamento de Comercio levantó los controles de exportación. Fable 5 regresó a los usuarios el 1 de julio.

Pero la restauración tuvo un precio. En la carta de acuerdo, Anthropic se comprometió a:

  • Buscar problemas de seguridad de forma proactiva en sus propios modelos
  • Coordinar con el gobierno en futuros lanzamientos
  • Reportar cualquier uso malicioso que detecte
  • Abrir un programa en HackerOne para que investigadores reporten jailbreaks de Fable 5
  • Dar al gobierno acceso anticipado para probar futuros modelos frontier antes del lanzamiento

Las negociaciones fueron lideradas por el co-fundador Tom Brown en lugar del CEO Dario Amodei, quien ha tenido conflictos con la administración durante gran parte del año.

Mythos 5 — el modelo subyacente sin guardrails — recibió un tratamiento diferente: el acceso regresó el 26 de junio para aproximadamente 100 empresas y agencias federales de EE.UU. que defienden infraestructura crítica. Anthropic dice que sigue trabajando con el gobierno para ampliar el acceso.


Lo que esto significa para cualquiera que construya sobre APIs de IA

Para las empresas que habían integrado silenciosamente esas herramientas en sus operaciones diarias, el sábado 13 de junio llegó con un vacío donde antes había un sistema que funcionaba.

Este es el riesgo que la mayoría de los tutoriales de "cómo construir con IA" nunca mencionan: cuando construyes sobre el modelo de un tercero, no tienes control sobre la disponibilidad de ese modelo. Y cuando el tercero recibe una directiva gubernamental a las 5:21 PM de un viernes, no hay tiempo de reacción.

La conclusión práctica para builders es diseñar sistemas que puedan cambiar de modelos y proveedores rápidamente, en lugar de depender de que un único modelo permanezca disponible.

Las implicaciones concretas para tu stack:

Multi-proveedor desde el principio. Si tu producto depende de un solo modelo de un solo proveedor, cualquier interrupción — gubernamental, técnica, comercial — detiene tu servicio. La arquitectura resiliente de 2026 incluye fallback a modelos alternativos: si Fable 5 cae, el sistema enruta a Opus 4.8 o GPT-5.5 automáticamente.

Abstracción de la capa de modelo. Herramientas como LiteLLM, el SDK de Vercel AI, o arquitecturas propias de routing permiten cambiar el modelo subyacente sin cambiar el código de la aplicación. Ese nivel de abstracción era un nice-to-have antes del 12 de junio. Después, se convierte en una decisión de arquitectura que cualquier equipo serio debería tomar.

Modelos open-weight como hedge. Varios developers trataron el episodio como un argumento para modelos open-weight o self-hosted que no pueden ser apagados desde afuera. Llama, Mistral y Qwen son opciones que corren en tu propia infraestructura. No tienen las capacidades de Fable 5 en benchmarks, pero tampoco pueden recibir una directiva gubernamental de suspensión.

Retención de datos y compliance. Anthropic requirió retención de 30 días de datos de clientes con Fable — una política que tiene costos reales para nosotros con clientes, pero que nos permite investigar y mitigar jailbreaks. Si construyes sobre modelos frontier, las políticas de retención de datos del proveedor afectan tu compliance. Conocerlas antes de un incidente es más barato que conocerlas durante uno.


El precedente que nadie quería establecer

Un executive order del 2 de junio creó un camino voluntario para que las empresas tengan modelos frontier revisados antes del lanzamiento. También estableció un benchmark clasificado para decidir qué modelos cuentan como "covered", mientras descartó cualquier licencia obligatoria para lanzar uno. Fable 5 nunca pasó por ese camino. El gobierno recurrió a los controles de exportación en cambio. Ese es el indicador: cuando Washington quiere moverse rápido sobre un modelo frontier, todavía no tiene un proceso vinculante, solo procesos improvisados.

Esa es la parte más incómoda de toda esta historia, y la que menos atención ha recibido en la cobertura: el gobierno de EE.UU. demostró que puede apagar un modelo de IA comercial desplegado a cientos de millones de personas, en horas, sin un proceso formal, sin evidencia presentada públicamente, y sin una definición acordada de qué constituye un riesgo suficiente para justificar esa acción.

El mecanismo legal usado — autoridad de control de exportaciones sobre capacidades de modelos de IA — no es único de Anthropic. Otras compañías con modelos suficientemente poderosos podrían enfrentar un escrutinio similar si se identifica una ruta de amenaza creíble.

Anthropic no es el único laboratorio en esta posición. Días antes, OpenAI hizo un preview de GPT-5.6 a un pequeño grupo aprobado por el gobierno en lugar del público, citando la misma preocupación de doble uso: un modelo suficientemente bueno para ayudar a los defensores a parchear bugs también es suficientemente bueno para ayudar a los atacantes a encontrarlos.


La industria que no sabía que necesitaba regulación hasta que llegó

Anthropic pasó años argumentando que la IA necesitaba supervisión gubernamental. Construyó su identidad pública sobre esa posición. Fue a Washington a testificar sobre los riesgos. Publicó papers técnicos sobre alignment y safety. Diseñó Fable 5 con guardrails específicamente para hacer pública la capacidad de Mythos de manera segura.

Y cuando la supervisión gubernamental llegó, llegó a las 5:21 PM de un viernes, sin evidencia escrita, sin proceso formal, sin definición técnica acordada de lo que constituía un riesgo inaceptable.

Anthropic coincide en que los gobiernos deben poder bloquear despliegues inseguros, pero solo "como parte de un proceso estatutario que sea transparente, justo, claro y fundamentado en hechos técnicos", y dijo que "esta acción no se adhiere a esos principios".

Diecinueve días después, Fable 5 regresó. El modelo más avanzado disponible al público está de vuelta. Pero el precedente quedó.

Cuando el próximo modelo frontier se lance — de Anthropic, de OpenAI, de Google, o de alguien más — la pregunta que esa empresa necesita responder antes del lanzamiento ya no es solo "¿es seguro?" Es también "¿qué pasa si el gobierno decide que no lo es, a las 5:21 PM de un viernes?"

Esa pregunta no tenía respuesta clara el 9 de junio de 2026. Tampoco la tiene hoy.


¿Tenías workflows construidos sobre Fable 5 cuando llegó el apagado? ¿Cómo lo manejaste? Cuéntalo en los comentarios. Y si quieres una guía de cómo construir arquitecturas multi-proveedor resilientes con fallback automático, déjalo abajo. 

Comentarios

Entradas populares de este blog