Anthropic lanzó el martes dos nuevos modelos de inteligencia artificial llamados Claude Fable 5 y Claude Mythos 5, que según la compañía tienen mayores capacidades que el modelo Mythos Preview lanzado en abril a varios socios de la industria tecnológica. Anthropic dijo que el lanzamiento inicial limitado surgió de la preocupación de que los delincuentes pudieran explotar las capacidades del modelo para desarrollar herramientas de piratería que pudieran tomar a los defensores con la guardia baja.
Actualmente, Anthropic solo está lanzando Claude Mythos 5 a un número limitado de socios de la industria, muchos de los cuales recibieron acceso a Mythos Preview, y la compañía dice que está colaborando con el gobierno de EE. UU. en el lanzamiento.
El Claude Fable 5, que se lanzará al público, utiliza el mismo modelo básico que el Mythos 5, pero tendrá “barandillas” en el lanzamiento, dijo la compañía el martes, lo que impedirá que el modelo responda las preguntas de muchos usuarios sobre ciberseguridad, biología y química. En cambio, estas solicitudes se redirigirán al modelo de IA anterior, Claude Opus 4.8. Si Anthropic sospecha que un usuario está intentando realizar una destilación (entrenar un modelo de IA más pequeño a partir de las respuestas de un modelo de IA más grande) en Claude Fable 5, la solicitud también será redirigida a Claude Opus 4.8, dijo la compañía.
En una entrevista con WIRED, la jefa de gestión de productos de Anthropic, Diane Penn, dijo que la compañía había estado lidiando con preguntas sobre cómo manejar las capacidades de descubrimiento de vulnerabilidades del software de Mythos y otras capacidades avanzadas desde antes de su lanzamiento en abril, pero las pruebas y los comentarios de los usuarios desde entonces ayudaron a perfeccionar la estrategia.
“Tratamos de realizar mejoras de una manera que sea útil, aunque no tenemos la (solución) perfecta para iniciar cada caso de uso”, dijo Penn. “De todos los diferentes enfoques, este surgió como el mejor y más viable. Finalmente sentimos que esta era la mejor opción de producto para que los usuarios obtengan el máximo valor de Fable 5”.
Por ahora, Penn dice que los mecanismos de protección están implementados con precaución, lo que significa que algunas preguntas de los usuarios pueden redirigirse a modelos de IA menos capaces incluso si no son maliciosos. Con el tiempo, Anthropic espera hacer su clasificación más precisa, pero Penn dijo que esta es la única forma segura para que la compañía publique ampliamente el modelo en este momento.
La compañía dijo el martes que además de ofrecer Claude Mythos 5 a los socios del Proyecto Glasswing, también brinda acceso a “investigadores biológicos seleccionados”. Además, las notas antrópicas en él publicación de blog sobre el lanzamiento del martes que proporciona una versión ilimitada a este pequeño grupo de clientes “hasta que nuestro programa de acceso confiable esté disponible”, insinuando planes futuros para expandir el acceso aún más. Desde el lanzamiento del Mythos en abril, Anthropic ha enfatizado repetidamente que eventualmente sus competidores tanto en el espacio privado como en el exterior seguramente también ofrecerán modelos con capacidades de nivel Mythos.
La capacidad de Claude Mythos y otros nuevos modelos de IA para diseñar herramientas de piratería informática que puedan encontrar y explotar vulnerabilidades en software nuevo y antiguo ha obligado a las empresas de tecnología y a los gobiernos de todo el mundo a proteger sus defensas de software antes de que los modelos de IA de este nivel estén ampliamente disponibles para los atacantes. Anthropic lanzó por primera vez Mythos a socios de la industria bajo un consorcio llamado Proyecto Glasswing, con la idea de que podría dar a los miembros una ventaja en la preparación de sus propios sistemas y considerar una solución global a la amenaza antes de que se lanzara más ampliamente.
Anthropic escribió en un renovar sobre el Proyecto Glasswing la semana pasada: “Estamos trabajando lo más rápido que podemos para liberar de forma segura las capacidades de nivel Mythos al acceso público. Para hacer esto, necesitamos salvaguardias muy fuertes para evitar el abuso de las capacidades cibernéticas de este modelo, protecciones que nosotros (y, hasta donde sabemos, todos los demás desarrolladores de IA) aún no hemos desarrollado”.


