¿Qué sucede cuando la IA comienza a construirse por sí misma?


Richard Socher ha sido una figura importante en la IA durante algún tiempo, mejor conocido por fundar la primera startup de chatbot You.com y, antes de eso, por su trabajo en ImageNet. Ahora se une a la generación actual de startups de IA centradas en la investigación con Recursive Superintelligence, una startup con sede en San Francisco que surgió silenciosamente el miércoles con 650 millones de dólares en financiación.

A Socher se une a la nueva empresa un grupo de investigadores líderes en inteligencia artificial, incluidos Peter Norvig y el cofundador de Cresta, Tim Shi. Juntos, están trabajando para crear un modelo de IA con automejora recursiva que pueda identificar de forma autónoma sus propias debilidades y rediseñarse para solucionarlas, sin participación humana, una característica de larga data de la investigación contemporánea en IA.

Hablé con él por Zoom después del lanzamiento, profundizando en el enfoque técnico único de Recursive y por qué no considera este nuevo proyecto como un neolaboratorio, un término informal para una nueva generación de nuevas empresas de IA que priorizan la investigación sobre la construcción de productos.

Esta entrevista ha sido editada para mayor extensión y claridad.

¡Escuchamos mucho sobre la recursividad estos días! Parece un propósito muy común en varios laboratorios. ¿Cuál considera que es su enfoque único?

Nuestro enfoque único es utilizar la apertura para lograr la superación personal recursiva, algo que nadie ha logrado nunca. Este es un objetivo que a muchas personas les resulta difícil de entender. Mucha gente supone que eso sucede cuando simplemente se realiza una investigación automatizada. Ya sabes, puedes tomar la IA y pedirle que mejore algo más, que podría ser un sistema de aprendizaje automático, o simplemente una carta que escribiste, o lo que sea, ¿verdad? Pero no se trata de una superación personal repetitiva. Es sólo una mejora.

Nuestro objetivo principal es construir una superinteligencia verdaderamente recursiva y autoextensible a escala, lo que significa que todo el proceso de ideación, implementación y validación de ideas de investigación será automatizado.

Primero (automatizará) las ideas de investigación de IA y, eventualmente, cualquier tipo de ideas de investigación, incluso en dominios físicos. Pero esto resulta muy útil cuando la IA trabaja sobre sí misma y desarrolla una nueva conciencia de sus propios defectos.

Utiliza el término abierto: ¿tiene un significado técnico específico?

Es verdad. De hecho, Tim Rocktäschel, uno de nuestros fundadores, lidera el equipo de apertura y autodesarrollo de Google DeepMind y trabajó específicamente en el modelo mundial Genie 3, que es un gran ejemplo de apertura. Puedes contar cualquier concepto, cualquier mundo, cualquier agente, y eso lo crea y es interactivo.

En la evolución biológica, los animales se adaptan al medio ambiente y luego otros animales se contraadaptan a esas adaptaciones. Es simplemente un proceso que puede desarrollarse durante miles de millones de años y siguen sucediendo cosas interesantes, ¿verdad? Así es como desarrollamos los ojos en nuestra (cabeza).

Otro ejemplo es el equipo arcoíris, de Otro artículo de Tim.. ¿Has oído hablar del equipo rojo?

Significado en ciberseguridad

Por lo tanto, el equipo rojo también debe realizarse en el contexto del LLM. Básicamente, estás intentando que el LLM te diga cómo fabricar una bomba y quieres asegurarte de que el LLM no funcione.

Ahora, los humanos pueden sentarse allí durante mucho tiempo y dar ejemplos interesantes de lo que la IA no debería decir. Pero, ¿qué pasa si pruebas esta primera IA con una segunda IA, y la segunda IA ​​ahora tiene la tarea de hacer que la primera IA (intente) decir todas las cosas malas que puedan suceder? Y luego pueden hacerlo de un lado a otro durante millones de iteraciones.

De hecho, puedes dejar que dos IA evolucionen juntas. Uno sigue atacando al otro, y luego aparece no sólo un ángulo sino muchos ángulos diferentes, y esa es la analogía del arco iris. Y luego podrás inocular la primera IA y estarás cada vez más seguro. Esta fue idea del equipo Rocktaeschel y ahora se utiliza en los principales laboratorios.

¿Cómo sabes cuando está terminado? No creo que eso se haya hecho nunca.

Algunas cosas nunca serán posibles. Siempre puedes ser más inteligente. Siempre puedes mejorar en programación, matemáticas, etc. Hay ciertos límites a la inteligencia; De hecho, estoy intentando formalizarlo ahora mismo, pero es demasiado grande. Estamos muy lejos de ese límite.

Como neolaboratorio, parece que se supone que debes hacer algo que los grandes laboratorios no hacen. Entonces, parte de la implicación aquí es que no crees que los grandes laboratorios lograrían RSI (automejora recursiva) haciendo lo que hacen. ¿Es justo decirlo?

No puedo comentar sobre lo que están haciendo, pero creo que nuestro enfoque es diferente. Realmente abrazamos el concepto de apertura y nuestro equipo está completamente enfocado en esa visión. Y el equipo ha estado investigando esto y trabajando en artículos en esta área durante la última década. Y este equipo tiene un historial de avances significativos en este campo y entrega de productos reales. Verás, el Equipo Shi convirtió a Cresta en un unicornio. Josh Tobin fue una de las primeras personas en OpenAI y finalmente dirigió el equipo del Codex y el equipo de investigación profunda.

De hecho, a veces tengo algunas dificultades con esta categoría de neolab. Siento que no somos sólo un laboratorio. Quiero que seamos una empresa que realmente pueda sobrevivir, tener productos increíbles que la gente adore y tener un impacto positivo en la humanidad.

Entonces, ¿cuándo planea enviar su primer producto?

He pensado mucho en eso. Este equipo ha progresado tanto que es posible que cambiemos el cronograma con respecto a nuestras suposiciones iniciales. Pero sí, habrá un producto y habrá que esperar unos trimestres, no años.

Una de las ideas en torno al autodesarrollo recursivo es que, una vez que tenemos este tipo de sistemas, la informática se convierte en el único recurso que importa. Cuanto más rápido se ponga en funcionamiento el sistema, más rápido mejorará, y ninguna actividad humana externa puede marcar realmente la diferencia. Entonces, la carrera es: ¿cuánta potencia de procesamiento podemos utilizar para esto? ¿Crees que ese es el mundo hacia el que nos dirigimos?

No se puede subestimar la informática. Creo que en el futuro una pregunta realmente importante será: ¿cuánta informática está dispuesta a gastar la humanidad para resolver qué problemas? Aquí está el cáncer y aquí está el virus: ¿cuál desea abordar primero? ¿Cuánta informática desea proporcionar? En última instancia, esto se convierte en una cuestión de asignación de recursos. Esta será una de las preguntas más importantes del mundo.

Cuando compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta nuestra independencia editorial.



Source link