EE.UU. ordena suspender Fable 5 y Mythos 5 de Anthropic por riesgo de jailbreak
El gobierno de Estados Unidos emitió este 12 de junio de 2026 una directiva de control de exportaciones que ordena la suspensión inmediata del acceso a los modelos de inteligencia artificial Fable 5 y Mythos 5 de Anthropic, por parte de cualquier persona extranjera, dentro o fuera del país. La medida, comunicada a las 5:21 p. m. (hora del Este), obliga a la compañía a deshabilitar ambos modelos para todos sus clientes, mientras el resto de la familia Claude sigue operativa.
La razón: un jailbreak potencial que afecta las salvaguardas de Fable 5
Según el comunicado oficial de Anthropic, el gobierno estadounidense cree haber identificado un método para eludir —o hacer jailbreak— a Fable 5 que podría exponer vulnerabilidades de ciberseguridad. La técnica consistiría en pedir al modelo que lea una base de código concreta y repare fallos de software. Anthropic revisó la demostración y asegura que las vulnerabilidades detectadas son «menores» y que otros modelos públicos, incluido GPT-5.5 de OpenAI (ver evaluación de ciberseguridad), pueden hallarlas sin necesidad de burlar defensas.
Este no es un modelo cualquiera. Fable 5 había sido presentado como el más avanzado de Anthropic, superando en rendimiento a competidores como GPT-5.5 y Gemini 3.1 Pro (lea nuestra cobertura del lanzamiento: Anthropic lanza Fable 5, el nuevo referente de Claude). Su suspensión representa un contraste brusco con las expectativas generadas en la industria de la inteligencia artificial.
Defensa en profundidad y monitoreo continuo
Anthropic defendió su estrategia de defensa en profundidad, diseñada para que los jailbreaks sean o muy limitados o extremadamente costosos de implementar. La compañía detalló que invirtió miles de horas en pruebas de seguridad (red-teaming) con el gobierno de EE. UU., el Instituto de Seguridad de IA del Reino Unido (AISI) y evaluadores privados, y que ningún probador ha encontrado un jailbreak universal capaz de desbloquear un amplio abanico de capacidades cibernéticas.
«De hecho, las salvaguardas de Fable son tan rigurosas que muchos usuarios se han quejado de que son demasiado amplias», señala el comunicado. Como refuerzo, Anthropic mantiene una política de retención de datos de 30 días para los modelos de clase Mythos (consulte la política), precisamente para investigar y mitigar cualquier ataque exitoso.
Reacción de Anthropic: desacuerdo con la base técnica de la orden
La empresa expresó su desacuerdo con que el hallazgo de un potencial jailbreak no universal justifique la retirada de un modelo comercial que sirve a «cientos de millones de personas». Advirtió que, si ese criterio se aplicara a toda la industria, «se detendrían prácticamente todas las implementaciones de nuevos modelos por parte de los desarrolladores frontera».
Anthropic también recordó su postura pública —expresada en documentos como Policy on the AI Exponential— a favor de que el gobierno tenga capacidad para bloquear despliegues inseguros, siempre que el proceso sea transparente, justo, claro y basado en hechos técnicos. Según la firma, la directiva recibida «no se adhiere a esos principios».
¿Qué sigue para los usuarios afectados?
Mientras Fable 5 y Mythos 5 permanecen inaccesibles, el resto de los modelos de Anthropic (incluido Claude) siguen disponibles. La compañía pidió disculpas por la interrupción y aseguró que trabaja «para restaurar el acceso lo antes posible». Adelantó que compartirá más detalles técnicos sobre el presunto jailbreak en las próximas 24 horas.
El episodio reaviva el debate sobre el equilibrio entre seguridad nacional e innovación en IA, especialmente en un momento en que herramientas como los modelos de lenguaje están cada vez más integradas en operaciones empresariales y gubernamentales a nivel global.
Con información de Anthropic.
Comunidad Arepa
Únete a nuestros canales principales
Comentarios
Relacionados
Ver más
Anthropic lanza Claude Sonnet 5: un modelo de IA más agéntico y seguro a menor costo

OpenAI lanza Daybreak: La nueva suite de IA para automatizar parches de ciberseguridad global
