Antrópico lo dijo desmanteló dos modelos de IA lanzados a principios de esta semana, Claude Fable 5 y Mythos 5, para cumplir con una directiva de control de exportaciones que recibió el viernes por la tarde del gobierno de EE. UU. citando preocupaciones de seguridad nacional.
Este incidente sin precedentes marca el último punto de conflicto entre Anthropic y la administración Trump. Aunque la compañía dijo que la orden le pide suspender el acceso a “cualquier ciudadano extranjero, ya sea dentro o fuera de los Estados Unidos, incluidos los empleados extranjeros de Anthropic”, la compañía ha eliminado el acceso a todos sus clientes para garantizar el cumplimiento.
A principios de este año, el Departamento de Defensa de Trump calificó a Anthropic como un “riesgo para la cadena de suministro” después de que los creadores de Claude intentaron trazar una línea roja sobre cómo el ejército estadounidense podría usar su tecnología. La designación prohíbe efectivamente a las agencias gubernamentales y a los contratistas utilizar tecnología Anthropic. Anthropic respondió presentando una demanda contra la administración Trump.
El martes, Anthropic lanzó públicamente Claude Fable 5, una versión del modelo Mythos AI de la compañía con salvaguardas que le impiden responder preguntas sobre ciberseguridad, biología y química. Antes de su lanzamiento público, que según Anthropic se realizó en colaboración con el gobierno de EE. UU., el modelo Mythos Preview AI recibió un lanzamiento limitado en abril. El objetivo es brindar a las empresas y organizaciones la oportunidad de utilizar capacidades sólidas de ciberseguridad para mejorar sus defensas y aliviar las preocupaciones de que los delincuentes puedan explotar la tecnología para desarrollar poderosas herramientas de piratería.
en un publicación de blog del viernes, Anthropic dijo que recibieron una carta del gobierno de Estados Unidos a las 5:21 p.m. hora del este. “La carta no proporciona detalles específicos sobre sus preocupaciones de seguridad nacional”, escribió Anthropic.
“Tenemos entendido que el gobierno cree que conoce un método para eludir o ‘hacer jailbreak’ a Fable 5”, añadió la empresa. “Revisamos una demostración de esta técnica particular utilizada para identificar una pequeña cantidad de vulnerabilidades previamente conocidas. Todas estas vulnerabilidades parecen relativamente simples y hemos descubierto que otros modelos disponibles públicamente también pueden encontrarlas sin necesidad de atajos”.
En su publicación de blog, la compañía argumentó que ha implementado fuertes protecciones para reducir la posibilidad de uso indebido de Claude Fable 5. Anthropic también afirma que el jailbreak que el gobierno de EE. UU. encontró para Claude Fable 5 es muy limitado y no expondría a los atacantes a más daño que con otros modelos de IA.
“Hasta la fecha, el gobierno sólo nos ha proporcionado evidencia verbal del potencial de un jailbreak limitado y no universal, esencialmente pidiendo al modelo que lea una base de código específica y corrija cualquier falla de software”, dijo la compañía en su blog. “Tenemos entendido que se ha compartido con el gobierno una posible fuga”.
Los portavoces de la Casa Blanca y el Departamento de Comercio de Estados Unidos no respondieron de inmediato a la solicitud de comentarios de WIRED.
El director ejecutivo de Anthropic, Dario Amodei, dijo en un ensayo político a principios de esta semana que él y su empresa apoyan un proceso gubernamental justo, estructurado y transparente que prohibiría la publicación de modelos de IA inseguros. En una publicación del blog de la empresa el viernes, Anthropic argumentó que “esta acción no cumple con esos principios”.



