¿Qué sucede si le das a un agente codificador de IA un laboratorio lleno de brazos robóticos, algunos recursos informáticos y un “gran presupuesto simbólico” para enseñar a los robots diversas tareas? Aparentemente, los agentes pudieron encontrar un régimen de entrenamiento que enseñó a los robots a cortar correas con éxito e incluso insertar GPU en zócalos delgados de placas base.
Una idea de cómo la IA puede actuar de forma totalmente autónoma para automatizar el entrenamiento de robots es posible gracias a nuevos marcos de trabajo para agentes: software que incluye modelos de IA para permitirles utilizar una variedad de herramientas y al mismo tiempo proporcionar capacidades como memoria, contexto, restricciones y bucles de retroalimentación. El arnés de seguridad del agente, llamado ENPIREdesarrollado por investigadores de robótica en el laboratorio NVIDIA GEAR (Generalist Embodied Agent Research) con colaboradores de la Universidad Carnegie Mellon en Pittsburgh y la Universidad de California, Berkeley.
“Partes de nuestro laboratorio NVIDIA GEAR han crecido implacablemente de la noche a la mañana”, escribió Jim Fan, director de IA de NVIDIA, en un publicación en LinkedIn. “Sólo leemos el informe por la mañana”.
Fan también describió en broma el propósito del entrenamiento de robots dirigido por IA, diciendo: “Estábamos todos de vacaciones y Jensen ni siquiera se dio cuenta”, refiriéndose al fundador y director ejecutivo de Nvidia, Jensen Huang. Pero no sólo los investigadores de robótica de Nvidia pueden beneficiarse de esto: Fan dice que su equipo abrirá todo el código fuente para que cualquiera pueda albergar un “laboratorio de robots autónomos en casa”.
El arnés ENPIRE tiene cuatro módulos que permiten a un agente de codificación de IA realizar un restablecimiento y verificación automáticos de tareas, refinar las políticas que guían el comportamiento del robot, evaluar esas políticas en múltiples robots físicos que trabajan en paralelo y resolver fallas mediante el análisis de registros, la ingesta de artículos de investigación y la mejora de la infraestructura de capacitación y el código de algoritmo. Más detalles técnicos están disponibles en trabajo de investigación subido el 16 de junio de 2026.
El arnés se probó con tres agentes de codificación de IA diferentes, incluido Codex OpenAI con GPT-5.5, Claude Code Anthropic con Opus 4.7 y Kimi Code Moonshot AI con Kimi K2.6. Equipos de agentes de codificación desarrollan de forma independiente diferentes enfoques algorítmicos para el entrenamiento de robots, los prueban en experimentos del mundo real y luego mantienen cualquier cambio que ayude a mejorar la tasa de éxito general a través de ciclos repetidos de autopruebas.



