Anthropic está presentando sus modelos de IA más potentes al público en general por primera vez, pero lo hace con limitaciones.
El martes, la empresa de inteligencia artificial lanzó Claude Fable 5, la primera versión del modelo Mythos disponible para el público. Anthropic dice que Fable 5 sobresale en ingeniería de software, trabajo de conocimiento y visión, pero tiene estrictas limitaciones de seguridad. En áreas de alto riesgo como la ciberseguridad, la biología, la química y la refinación, el modelo bloquea la respuesta y vuelve a Claude Opus 4.8.
Lanzado como vista previa en abril, Mythos inicialmente se limitó a unos pocos socios debido a preocupaciones de ciberseguridad. La semana pasada, Anthropic amplió el acceso a cientos de organizaciones en 15 países y una vez más se centró en organizaciones que gestionan infraestructura crítica.
Ahora, una versión de la tecnología está disponible para cualquier persona a través de la API de Claude Anthropic y los planes empresariales basados en el consumo. El acceso a las suscripciones se implementará por etapas: hasta el 22 de junio, Fable 5 está incluido en los planes Pro, Max, Team y Enterprise basados en asientos sin costo adicional. El 23 de junio, Anthropic eliminará Fable 5 del plan, lo que requerirá créditos de uso futuro, y planea restablecerlo como una función de suscripción estándar lo antes posible.
Anthropic también está implementando una nueva versión de Mythos, llamada Mythos 5, en organizaciones que han sido aprobadas para acceder al modelo avanzado.
El lanzamiento de Fable se produce mientras Anthropic se prepara para ingresar a los mercados públicos, junto con OpenAI y SpaceX de Elon Musk. Esto también sigue Aplicación de empresa de IA insta a los principales laboratorios de IA a nivel mundial a realizar esfuerzos coordinados para el desarrollo de IA de vanguardia. Anthropic advierte que los sistemas están evolucionando tan rápidamente que pronto podrían alcanzar la automejora recursiva (RSI), que se reparará de forma autónoma sin intervención humana.
Preocupado por lo que el modelo clase Mythos podría hacer en las manos equivocadas, Anthropic dijo que probó su clasificador con un intento de jailbreak antes de lanzar Fable 5.
“Internamente, ejecutamos una recompensa por errores externos que no resultó en un jailbreak universal en más de 1000 horas de pruebas. Luego trabajamos con una organización externa del equipo rojo que tampoco logró encontrar un jailbreak universal”.
Sin embargo, todavía existe la posibilidad de que se produzcan nuevos ataques. Como resultado, con el lanzamiento de Fable 5 y Mythos 5, Anthropic dijo que requeriría una retención de 30 días en todo el tráfico, a pesar de que la empresa tenía anteriormente un acuerdo de retención cero. Anthropic dijo que no utilizaría los datos para entrenamiento, sólo para “defenderse contra ataques complejos y novedosos, incluidos nuevos jailbreak” e “identificar y reducir los falsos positivos”. Esta política podría sentar un precedente en la industria en la que el acceso a modelos cada vez más sofisticados vaya acompañado de políticas obligatorias de retención de datos enmarcadas como medidas de seguridad.
Para aquellos que siguen el modelo, no todas las preguntas obtendrán una respuesta de Fable 5. Anthropic dice que los casos en los que Fable tiene que ceder ante Opus 4.8 son raros, y los primeros datos muestran que al menos el 95% de las sesiones de Fable se ejecutan completamente en función de las propias respuestas del modelo.
En pruebas de terceros, la empresa de análisis Hex dijo en un comunicado que Fable fue la primera empresa en obtener una puntuación del 90% en su punto de referencia de análisis principal para tareas analíticas complejas y de larga duración.
“En las preguntas más difíciles, demuestra un fuerte juicio y atención a los matices”, dijo Hex.
La plataforma de codificación por vibración Base44 señaló en un comunicado que Fable es mejor en “aplicaciones completas de una sola vez” y tiene excelentes llamadas de herramientas. La plataforma de agentes y espacio de trabajo impulsada por IA, Genspark, dice que Fable superó a todos los demás modelos en su evaluación y tuvo un desempeño mucho mejor en tareas como el diseño de la interfaz de usuario y la codificación de juegos.
Los precios de Fable 5 y Mythos 5 son de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida, el doble del precio de Opus 4.8. El precio por sí solo puede ser una barrera para su uso generalizado.
Muchas empresas se han vuelto cada vez más críticas con los costos de la IA después de ver llegar facturas o agotar sus presupuestos anuales de IA antes de tiempo. Los modelos avanzados como Opus 4.8 pueden exacerbar el problema, con habilidades de razonamiento avanzadas que pueden dividir una única solicitud en múltiples tareas.
Las estimaciones antrópicas de que la demanda de Fable 5 será muy alta y difícil de predecir. Y, de hecho, algunos, como la plataforma de recompensas por compras Rakuten, pueden pensar que los beneficios valen el precio.
“Con el máximo esfuerzo, Fable refleja y valida su propio trabajo”, dijo Rakuten en un comunicado. “Para nosotros, eso es lo que permite operaciones altamente autónomas: el esfuerzo adicional vale la pena”.
Cuando compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta nuestra independencia editorial.



