Recopilar datos de entrenamiento de robots es un trabajo sucio y poco glamoroso. Algunos laboratorios de IA ya están pagando a XDOF para hacer esto


Hace dos semanas, OpenAI dicho relanzará su programa de robótica cerrado en 2021, la última señal de que los laboratorios de inteligencia artificial más grandes están compitiendo para enseñar a las máquinas a operar en el mundo físico. Pero construir robots capaces requiere algo que la industria de la IA aún no tiene, es decir, datos de entrenamiento que coincidan con los utilizados para los modelos de lenguaje.

La brecha está creando un nuevo tipo de negocio de infraestructura. A diferencia de los LLM que se capacitan en vastos mares de texto disponible públicamente, los robots necesitan datos que capturen interacciones físicas, y esos datos son casi inexistentes. Los vídeos y grabaciones de YouTube realizados por trabajadores autónomos son de baja calidad y difíciles de conciliar con el mundo físico.

XDOF (pronunciado “ecks-doff”), saliendo de su modo sigiloso actual, apuesta a que el próximo gran cuello de botella en la IA no serán los modelos o los chips, sino los circuitos de retroalimentación de datos necesarios para enseñar a los robots a interactuar con el mundo físico.

La startup tiene como objetivo crear canalizaciones de datos, herramientas de recopilación y sistemas de anotación que los principales laboratorios y empresas de robótica no pueden construir fácilmente por sí mismas, y ha recaudado 70 millones de dólares de Thrive Capital, Spark Capital, a16z, Lux y WndrCo para hacerlo. El cofundador y director ejecutivo, Philippe Wu, dijo que XDOF, que tiene alrededor de 60 empleados, ha trabajado con 20 clientes, incluidos algunos laboratorios de inteligencia artificial líderes, pero no pudo nombrarlos.

“Todos los laboratorios líderes están intentando desarrollar la robótica”, dijo Wu. “Hemos visto algunas desventajas de estar un poco atrasados ​​en la carrera por los modelos de lenguaje… No querrás estar en una situación como ésta en la que tardes en ponerte al día con esta tecnología, y todos los demás están en una situación en la que la IA física está por delante”.

El propio Wu experimentó este problema cuando era estudiante de doctorado en UC Berkeley. La atención se centra en permitir que los robots aprendan habilidades a partir de conjuntos de datos a gran escala. Sólo hay un problema.

“No tenemos datos a gran escala con los que trabajar”, dijo a TechCrunch. “Existe el problema del huevo y la gallina: primero tenemos que recopilar datos antes de poder preguntar cómo entrenar un modelo robótico básico”.

Wu y su cofundador y futuro CTO de XDOF, Fred Shentu, trabajaron en un proyecto llamado GELLO, un sistema de teleoperación de bajo costo que permitía a un operador humano controlar un brazo robótico para generar datos de entrenamiento. “Este terminó siendo un artículo muy influyente en el campo de la robótica, porque muchas personas tenían necesidades y limitaciones similares, y muchos comenzaron a utilizar este tipo de dispositivo para la recopilación de datos”, dijo Wu.

Al ver la oportunidad, Wu, Shentu y el tercer cofundador y director de operaciones, Nemo Jin, lanzaron XDOF en octubre de 2024 para proporcionar un ecosistema de datos para las empresas que buscan un modelo robótico. Teniendo en cuenta que simplemente proporcionar datos puede ser un negocio sin futuro, la empresa también se está centrando en la limpieza de datos, herramientas y anotaciones, creando comentarios que se refuerzan a sí mismos para los entrenadores de robots.

Como punto de partida, la compañía se asoció con el laboratorio de investigación de inteligencia artificial de UC Berkeley para publicar la mayor colección de datos de entrenamiento de robots de alta calidad jamás recopilada, denominada ABC. Incluye 130.000 pases de datos de manipulación de robots, 300 horas de simulación y 100 horas de evaluación. Los académicos nunca antes habían tenido a su disposición datos de preformación tan amplios.

“Hemos visto en lenguajes, generación de imágenes y otros campos, que cuando se publican modelos y datos, la comunidad logra cosas que no necesariamente se esperarían”, dijo a TechCrunch David McAllister, un estudiante de doctorado de Berkeley que ayudó a organizar el lanzamiento.

El equipo ha utilizado los datos para entrenar robots en tareas estándar como doblar camisetas y aplanar cajas, o poner AirPods en sus estuches.

Grados de libertad ilimitados

La empresa prevé trabajar en tres niveles de la pirámide de datos. El nivel más valioso son los datos de teleoperación recopilados sobre el robot real que se está implementando; los siguientes son robots teleoperados que recopilan datos más generales, como GELLO; y finalmente, datos “egocéntricos” recopilados por humanos que realizan tareas cotidianas, y XDOF planea crear sus propios sensores portátiles.

“Su elección de cámara afectará la calidad de sus datos, lo que afectará el rendimiento de su algoritmo de seguimiento manual”, dijo Wu. “Si no diseña bien su hardware desde el principio, los datos que recopile pueden tener problemas muy específicos que no anticipó”.

La compañía planea contratar y capacitar a un ejército de teleoperadores y operadores de datos egocéntricos en todo el mundo, un modelo que requiere mucha mano de obra y que plantea una pregunta obvia: ¿por qué los grandes laboratorios no realizan ellos mismos esta producción de datos?

“Se necesitan cientos de miles de pies cuadrados de almacenes con cientos de robots”, dijo Wu. “Es necesario mantener estos robots, calibrar sus parámetros físicos y capacitar a los operadores adecuadamente”.

Es una construcción que requiere concentración, capital y escala operativa que la mayoría de los laboratorios de IA prefieren subcontratar, y este es el mercado en el que apuesta XDOF.

El nombre XDOF es un juego de palabras con el término robótico “grados de libertad”, que describe la cantidad de movimientos independientes que puede realizar un robot. Tus brazos, desde los hombros hasta las muñecas, están siete grados de libertad. El robot más nuevo de la empresa de robots humanoides, Figure.AI, tiene 30 robots. La X en el nombre de la empresa refleja su ambición: “Grados arbitrarios de libertad, grados ilimitados de libertad”, dijo Wu.

Cuando compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta nuestra independencia editorial.



Source link