El nuevo modelo de Claude es más ‘honesto’ a la hora de hacer lío


Anthropic lanzó el Claude Opus 4.8 el jueves y la compañía promocionó la “honestidad” del modelo.

De acuerdo a a antrópicoentrena a “todos sus modelos para que sean honestos, por ejemplo, para evitar hacer afirmaciones que no pueden respaldar”. Pero el informe señala que “un problema común con los modelos de IA es que a veces sacan conclusiones precipitadas y presentan con confianza su trabajo como un progreso incluso cuando hay poca evidencia”.

AI Lab afirma que los primeros evaluadores descubrieron que es más probable que Opus 4.8 muestre incertidumbre sobre su rendimiento y menos probabilidades de hacer afirmaciones sin fundamento. En la evaluación de la compañía, Opus 4.8 tenía “aproximadamente 4 veces menos probabilidades que su predecesor de permitir que las fallas en el código que escribió pasaran desapercibidas”.

Además de una mayor honestidad, con Opus 4.8, los usuarios pueden dirigir la cantidad de esfuerzo que Claude pone en una tarea. Las respuestas de mayor esfuerzo utilizarán más tokens, lo que brindará a los usuarios la opción de respuestas de menor esfuerzo si no quieren exceder rápidamente su límite de velocidad.

Anthropic también lanzó una función llamada “flujo de trabajo dinámico” en la vista previa de la investigación, que según la compañía permitirá a Claude “asumir tareas más grandes”. Con flujos de trabajo dinámicos, “Claude puede planificar trabajos y luego ejecutar cientos de subagentes paralelos en una sola sesión (y con Opus 4.8, los agentes pueden ejecutar incluso más tiempo). Luego verifica el resultado antes de informar al usuario”.



Source link