El mundo de la IA se está volviendo ‘loco’


El viernes, el creador de Claude Code, Boris Cherny, apareció en la conferencia @Scale Meta y, sorprendentemente, la primera pregunta de la audiencia fue sobre bucles.

“¿Es el bucle otro ciclo de exageración”, preguntó el interrogador, “o es real?”

La respuesta de Cherny fue enfática: “Sí, es real”.

“Hace dos años, escribíamos el código fuente a mano. Comenzamos la transición para que los agentes escribieran el código. Y ahora estamos avanzando al punto en el que los agentes les piden que luego escriban el código”, continuó. “Por muy grande que sea el paso del código fuente al agente, el ciclo es igualmente importante y un gran paso”.

Más adelante en la charla (alrededor de las 32:00 en el video de YouTube publicado arriba), Cherny entra en detalles sobre el ciclo que sigue ejecutando en su propio trabajo. Un agente busca constantemente formas de mejorar la arquitectura del código, mientras que el otro agente busca abstracciones duplicadas que puedan unificarse. Envían solicitudes de extracción como cualquier otro codificador y, como el código cambia constantemente, nunca dejan de ejecutarse.

Es una idea poderosa, especialmente con una figura tan importante como Cherny detrás. Con el cambio a agentes de IA, la atención de la mayoría de los usuarios se centra en gestionar sus agentes lo mejor posible: establecer objetivos claros, comprobar unidades de progreso separadas y no permitir que se desvíen demasiado de lo esperado. Este bucle va un paso más allá al permitir que un enjambre de agentes trabaje continuamente en segundo plano, sin detenerse. Se confía ampliamente en la IA, pero a medida que los modelos avanzan más rápidamente, este podría ser el siguiente paso para hacer que la IA sea capaz de manejar trabajos reales.

Lo primero que hay que tener en cuenta es que esto no es algo completamente nuevo. Los bucles recursivos (funciones que se llaman a sí mismas para repetir una acción, junto con condiciones que detienen el bucle) son un pilar de los cursos de introducción a la informática. Estos ciclos siguen una lógica no determinista (es decir, los subagentes eligen cuándo detener el ciclo en lugar de condiciones explícitas), pero se aplica el mismo enfoque básico. Tan pronto como los programadores comiencen a utilizar la IA para completar tareas, inevitablemente surgirá alguna versión de un bucle recursivo, con una IA supervisando a otra IA.

A diferencia de la informática clásica, los bucles de agentes pueden ser muy sencillos. Uno de los trucos más populares es Círculo de Ralph (llamado así por Ralph Wiggum), que básicamente resume todo el trabajo que ha realizado el modelo y pregunta si ha logrado sus objetivos. Esta es una forma de lidiar con un modelo de IA que pierde terreno porque se ejecuta demasiado tiempo; esencialmente, hace que el modelo rebote hasta que termine su trabajo.

Otra forma de pensar en los bucles es como parte de un impulso general para una mayor informática en el momento de las pruebas. Como observó el investigador de OpenAI, Noam Brown a principios de este mesLos modelos contemporáneos pueden resolver casi cualquier problema si se utiliza suficiente informática. Esto significa que una forma de garantizar que se resuelva un problema es continuar computando hasta que se resuelva el problema. Esto es especialmente cierto para problemas de escalada, como las actualizaciones de la base de código, donde el modelo puede continuar realizando mejoras incrementales hasta alcanzar un cierto umbral. O, como en el ejemplo de Cherny, puede seguir realizando mejoras incrementales mientras haya computación para dedicarle.

Si parece caro, debería serlo. Al igual que la IA del agente anterior, el bucle de IA quema tokens mucho más rápido que un simple chatbot de preguntas y respuestas, y como el objetivo es mantener el bucle funcionando todo el tiempo, no hay límite en cuanto a cuánto puede gastar. Eso es genial para Anthropic, que en última instancia se dedica al negocio de la venta de tokens, pero para todos los demás, podría ser una forma costosa de trabajar.

Sin embargo, dependiendo del problema que el bucle agente intente resolver y de la configuración adecuada que permita monitorear el gasto de tokens, la deriva y otros problemas clásicos de la IA, los beneficios pueden superar con creces los costos.

Cuando compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta nuestra independencia editorial.



Source link