Los funcionarios de la administración Trump finalizaron las conversaciones con Anthropic el lunes sin levantar los controles de exportación impuestos la semana pasada a los modelos de inteligencia artificial más avanzados de la compañía en respuesta a preocupaciones sobre el jailbreak, según tres personas informadas sobre el asunto.
El gobierno sigue creyendo que hay una manera de desactivar algunas de las barreras de seguridad en Claude Fable 5 de Anthropic, permitiendo efectivamente a los usuarios acceder a las capacidades de ciberseguridad más sólidas del modelo Mythos de la compañía, dijeron las fuentes.
Anthropic ha dicho durante días que las preocupaciones de la administración son exageradas, una posición reiterada en una reunión de un grupo de trabajo celebrada en el Departamento de Comercio con investigadores gubernamentales del Centro de Estándares e Innovación de IA (CAISI) y la Oficina del Director Nacional Cibernético Sean Cairncross, dijo una de las fuentes.
A la reunión también asistió el Ministro de Comercio, Howard Lutnick, quien realizó una conferencia telefónica desde la cumbre del G7 en Evian, Francia. El propio Cairncross no participó, dijo la persona.
En el lado antrópico, el cofundador y director de informática Tom Brown y la jefa de asuntos externos Sarah Heck lideraron la discusión. El jefe del equipo de frontera roja de Anthropic, Logan Graham, y el investigador principal de seguridad Nicholas Carlini volaron a Washington, DC para conversar.
“Ambas partes trabajaron rápidamente para resolver este problema”, dijo un portavoz de Anthropic en un comunicado a WIRED. Un portavoz de la Casa Blanca declinó hacer comentarios.
Aún no está claro cómo se darán los próximos pasos. El Departamento de Comercio expresó su voluntad de encontrar una manera de que Fable 5 vuelva a estar en línea para uso del consumidor, pero probablemente dependa de que Anthropic resuelva completamente el problema del jailbreak, dijo la persona.
hacer sonar la alarma
Las conversaciones de emergencia se producen en medio de un momento político desafiante para Anthropic, que durante mucho tiempo ha estado en desacuerdo con el Pentágono sobre si sus modelos de inteligencia artificial pueden usarse para ciertas aplicaciones militares.
La administración Trump fue notificada por primera vez sobre las preocupaciones sobre las fugas de prisión la semana pasada. El director ejecutivo de Amazon, Andy Jassy, llamó directamente al secretario del Tesoro, Scott Bessent, sobre la supuesta vulnerabilidad, que contribuyó a asustar al gobierno, dijeron las fuentes. La conversación de Jassy con la administración Trump fue la primera reportado por Información.
Los funcionarios preocupados de la Casa Blanca asignaron a la NSA para ayudar a revisar las vulnerabilidades. La NSA respondió que creía que era posible eliminar las barreras de seguridad de Fable 5, lo que llevó al gobierno a imponer restricciones al modelo.
Luego, Lutnick habló con el director ejecutivo de Anthropic, Dario Amodei, el viernes, mientras el Departamento de Comercio redactaba su carta imponiendo controles de exportación a Fable 5. Durante el fin de semana, después de que Anthropic cortara el acceso al modelo a todos los usuarios, Lutnick tuvo varias llamadas telefónicas con Brown y Heck, según una persona familiarizada con los eventos.
No está claro por qué Amazon, uno de los mayores inversores en Anthropic, advirtió a Fable 5. “Como proveedor líder de nube que atiende a un gran número de clientes del sector público y privado, no es raro que los gobiernos busquen nuestro asesoramiento sobre posibles riesgos de seguridad”, dijo un portavoz de Amazon a WIRED. “Cuando eso sucede, no compartimos los detalles de estas discusiones”.
Terminación de seguridad
En el centro de la conversación entre Anthropic y el gobierno estaba un desacuerdo sobre la gravedad del problema del jailbreak de Claude Fable 5.
en un publicación de blog El viernes, Anthropic dio a entender que la caracterización de los riesgos potenciales por parte del gobierno era exagerada. Varios investigadores de ciberseguridad reiteraron esta posición a los funcionarios el lunes, enviando carta abierta argumentó que las medidas de control de exportaciones adoptadas contra Anthropic estaban injustificadas.
“Los modelos de clase Mythos de Anthropic son bastante buenos para encontrar debilidades y convertir exploits en armas. Sin embargo, no son particularmente buenos en estas tareas, y muchas de las personas abajo firmantes utilizan regularmente modelos básicos y otras fuentes abiertas para auditorías de seguridad y equipos rojos a diario”, se lee en la carta abierta. “Como resultado, estas acciones han eliminado los mejores modelos de los defensores, han creado incertidumbre en el mercado y han puesto en riesgo el liderazgo de la IA de Estados Unidos sin ningún riesgo real que justifique tales acciones”.



