La Casa Blanca quiere que Anthropic bloquee todas las fugas de prisión. Probablemente eso no sea posible


Administración Trump Los desacuerdos con Anthropic sobre sus modelos de IA más avanzados parecen inminentes.

Los funcionarios de Trump dijeron a Inner Loop que si Anthropic quiere volver a publicar Claude Fable 5, el modelo de IA que desconectaron con controles de exportación la semana pasada debido a preocupaciones sobre el jailbreak (un método que utiliza comandos para eludir las salvaguardas del modelo), la compañía debe tomar medidas para abordar realmente lo que el gobierno alega son vulnerabilidades.

Antrópico lo tiene dicho por días que las preocupaciones del gobierno eran exageradas y que el impacto de la fuga de la prisión era insignificante. Reiteraron esta posición al Departamento de Comercio y a la Oficina del Director Nacional Cibernético, Sean Cairncross, en una reunión técnica el lunes.

Pero los funcionarios dicen que ya no están debatiendo si el jailbreak es necesario, ya que la Agencia de Seguridad Nacional concluyó que hay una manera de desactivar las barreras de seguridad en Fable 5, que se implementaron para evitar que los usuarios accedan a las capacidades del modelo Mythos relacionadas con la ciberseguridad, la química y la biología.

En esta etapa, el gobierno considera esencialmente la situación como un problema antrópico que debe solucionarse, según tres personas familiarizadas con las discusiones.

Ni el Centro de Estándares e Innovación de IA del Departamento de Comercio ni la Agencia de Seguridad Nacional tienen el personal o el ancho de banda para buscar todas las fugas posibles en cada modelo que llega al mercado, dijeron las fuentes.

Por lo tanto, el gobierno cree que Anthropic debería ser más proactivo al continuar probando no solo Fable 5 sino también todos sus principales modelos de inteligencia artificial para encontrar posibles fugas e informarlas directamente al gobierno.

Pero en un nivel más básico, todavía no está claro cómo se supone que Anthropic evitará el jailbreak.

Los expertos independientes en ciberseguridad opinan cada vez más que las restricciones a los modelos de IA son sólo una solución temporal, ya que los usuarios capacitados y los futuros modelos de IA encontrarán formas de superar esas limitaciones, lo que significa que lo que la Casa Blanca parece querer no se puede hacer.

Un portavoz de la Casa Blanca declinó hacer comentarios.

DNI = No Invitar

A principios de esta semana, el elegido por Trump para director interino de Inteligencia Nacional, Bill Pulte, estaba en camino de nunca asumir el cargo. Ahora, Trump le ha echado una mano y el candidato permanente del DNI, Jay Clayton, ahora enfrenta la posibilidad de no volver a ocupar el cargo nunca más.

En resumen: Trump nombró inicialmente a Pulte, su jefe de finanzas de vivienda, para reemplazar a la saliente DNI Tulsi Gabbard.

Enfrentando resistencia bipartidista porque Pulte carece de la experiencia en seguridad nacional requerida por ley para el cargo y porque marcó supuestamente cuestionable Tras las acusaciones de fraude hipotecario contra los enemigos políticos de Trump, Trump anunció a Clayton, el fiscal federal para el Distrito Sur de Nueva York, como su candidato para el DNI permanente.

Está previsto que Gabbard se vaya el 18 de junio, y el primer día de Pulte será el 19 de junio. Pero los republicanos del Senado se preguntan: si Clayton puede acelerar su juicio hasta el 17 de junio y comenzar el 22 de junio, ¿entrará Pulte al edificio?

El miércoles, Trump puso fin a esos planes. Como parte de una disputa más amplia con el liderazgo republicano del Senado sobre el obstruccionismo, Trump anunció que el juicio de Clayton se pospondría indefinidamente, en un aparente esfuerzo por evitar que Pulte fuera atacado. Republicanos del Senado en ese momento anunciado que la audiencia continuaría, a menos que Clayton no compareciera o se retirara su nominación.

La situación puede ser un duro golpe para la Oficina del Director de Inteligencia Nacional, donde Trump ha ordenado a Pulte que reduzca en gran medida el número de sus miembros, y el personal no está impresionado con lo que ven como esfuerzos mínimos de Pulte para conocer la agencia y la falta de sesiones informativas periódicas, dijeron personas familiarizadas con el asunto.



Source link