Home Tecnología Los agentes de codificación de IA pueden dirigir de forma independiente el...

Tecnología

Los agentes de codificación de IA pueden dirigir de forma independiente el entrenamiento de robots

June 17, 2026

¿Qué sucede si le das a un agente codificador de IA un laboratorio lleno de brazos robóticos, algunos recursos informáticos y un “gran presupuesto simbólico” para enseñar a los robots diversas tareas? Aparentemente, los agentes pudieron encontrar un régimen de entrenamiento que enseñó a los robots a cortar correas con éxito e incluso insertar GPU en zócalos delgados de placas base.

Una idea de cómo la IA puede actuar de forma totalmente autónoma para automatizar el entrenamiento de robots es posible gracias a nuevos marcos de trabajo para agentes: software que incluye modelos de IA para permitirles utilizar una variedad de herramientas y al mismo tiempo proporcionar capacidades como memoria, contexto, restricciones y bucles de retroalimentación. El arnés de seguridad del agente, llamado ENPIREdesarrollado por investigadores de robótica en el laboratorio NVIDIA GEAR (Generalist Embodied Agent Research) con colaboradores de la Universidad Carnegie Mellon en Pittsburgh y la Universidad de California, Berkeley.

“Partes de nuestro laboratorio NVIDIA GEAR han crecido implacablemente de la noche a la mañana”, escribió Jim Fan, director de IA de NVIDIA, en un publicación en LinkedIn. “Sólo leemos el informe por la mañana”.

Fan también describió en broma el propósito del entrenamiento de robots dirigido por IA, diciendo: “Estábamos todos de vacaciones y Jensen ni siquiera se dio cuenta”, refiriéndose al fundador y director ejecutivo de Nvidia, Jensen Huang. Pero no sólo los investigadores de robótica de Nvidia pueden beneficiarse de esto: Fan dice que su equipo abrirá todo el código fuente para que cualquiera pueda albergar un “laboratorio de robots autónomos en casa”.

El arnés ENPIRE tiene cuatro módulos que permiten a un agente de codificación de IA realizar un restablecimiento y verificación automáticos de tareas, refinar las políticas que guían el comportamiento del robot, evaluar esas políticas en múltiples robots físicos que trabajan en paralelo y resolver fallas mediante el análisis de registros, la ingesta de artículos de investigación y la mejora de la infraestructura de capacitación y el código de algoritmo. Más detalles técnicos están disponibles en trabajo de investigación subido el 16 de junio de 2026.

El arnés se probó con tres agentes de codificación de IA diferentes, incluido Codex OpenAI con GPT-5.5, Claude Code Anthropic con Opus 4.7 y Kimi Code Moonshot AI con Kimi K2.6. Equipos de agentes de codificación desarrollan de forma independiente diferentes enfoques algorítmicos para el entrenamiento de robots, los prueban en experimentos del mundo real y luego mantienen cualquier cambio que ayude a mejorar la tasa de éxito general a través de ciclos repetidos de autopruebas.

Source link

RELATED ARTICLESMORE FROM AUTHOR

No, no quiero ver tu programa de hockey directo

Epic quiere permitirte llevar tus máscaras de Fortnite a otros juegos

La demanda de la FTC revela cómo las redes de fraude por suscripción evaden la aplicación de la ley en las tiendas de aplicaciones

RELATED ARTICLES MORE FROM AUTHOR