Anthropic lanzó su último modelo Fable el martes, calificándolo de una versión pública y limitada de su poderoso y muy querido modelo de ciberseguridad Mythos.
Pero no todo el mundo está contento con las restricciones y un numero de seguridad cibernética investigador Y profesional ha sido transmitido queja en línea.
“(Fable) rechaza cualquier solicitud que pueda estar relacionada con el ciberespacio. Incluso tareas tan inofensivas como leer publicaciones de blogs”, dicho Valentina “Chompie” Palmiotti, reconocida investigadora de seguridad que trabajó en IBM X-Force.
Cuando un comando activa sus barreras de seguridad, Fable detiene el chat y dice que “sus medidas de seguridad señalan este mensaje sobre temas de ciberseguridad o biológicos”.
Existen medidas de seguridad para limitar el riesgo de que Fable se utilice para desarrollar malware o comprometer software. preocupaciones de larga data en Antrópico. Las restricciones a los productos biológicos surgen de preocupaciones similares desarrollando armas biológicas.
Cuando el gigante de la inteligencia artificial lanzó Mythos en abril, limitó el modelo a solo un puñado de empresas y organizaciones en lo que llamó Proyecto Glasswing, un esfuerzo por aplicar el modelo para proteger el software y la infraestructura críticos. La semana pasada, Anthropic amplió el acceso a Mythos a cientos de organizaciones en 15 países.
Pero a pesar de las buenas intenciones, muchos expertos en ciberseguridad siguen siendo escépticos sobre la naturaleza azarosa de estas restricciones. Matt Suiche, un veterano en ciberseguridad, dijo a TechCrunch que “si les pides que escriban código seguro, asumirán que se trata de un trabajo relacionado con la ciberseguridad, no de las mejores prácticas de ingeniería de software, y tu clasificación bajará”. Fable está programado para volver a Claude Opus 4.8 si choca contra una barandilla. “Parece que se basa en palabras clave, por lo que cualquier cosa en el campo léxico de la ‘ciberseguridad’ activará barreras de seguridad”.
contáctanos
¿Tiene más información sobre cómo los piratas informáticos utilizan la IA? ¿O cómo las empresas de ciberseguridad utilizan la IA? Queremos escuchar tu opinión. Desde dispositivos y redes que no sean del trabajo, puede comunicarse con Lorenzo Franceschi-Bicchierai de forma segura en Signal al +1 917 257 1382, o vía Telegram y Keybase @lorenzofb, o correo electrónico.
“Pero esto es comprensible porque todavía estamos en las primeras etapas y ellos todavía se están ajustando a los límites. Estoy seguro de que se desarrollarán con el tiempo a medida que Anthropic y otras empresas modelo líderes colaboren más con la nueva generación actual de empresas de ciberseguridad”, dijo Suiche, miembro del personal técnico de Tolmo, una startup de ciberseguridad de IA. “Es mejor atrapar a más personas que no suficientes cuando se hacen liberaciones como esa y se aflojan las barreras con el tiempo”.
Otros investigadores suspiro en X que “incluso solicitar una revisión del código” activa las barreras de seguridad de Fable.
Anthropic no respondió de inmediato a una solicitud de comentarios.
Además de las barreras de seguridad de su modelo, Anthropic necesita profesionales de ciberseguridad para implementarlo. Programa de verificación cibernética. Si se aprueba, los solicitantes tendrán menos restricciones para utilizar Claude para trabajos de ciberseguridad. OpenAI tiene un programa similar llamado Acceso confiable para cibernética.
Cuando compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta nuestra independencia editorial.



