Elon, deja de intentar hacer que Grok suceda.


Hay una dura realidad sobre el chatbot de inteligencia artificial Grok, que “busca la verdad” de Elon Musk: no es muy bueno y no mucha gente lo está usando. Esa es la conclusión de lo nuevo. Reuters informeque encontró que Grok apenas apareció en los registros federales sobre cómo el gobierno de EE. UU. utilizó la IA el año pasado. Esta no es la única señal de que el chatbot característico de xAI está en problemas, incluso cuando Musk lo sitúa en el centro de lo que podría ser la oferta pública inicial más grande de la historia.

Reuters revisó más de 400 ejemplos de uso gubernamental de IA que nombraban proveedores específicos. Se descubrió que Grok o xAI solo aparecen en tres aplicaciones, una para usos básicos como redacción de documentos o gestión de redes sociales, y siempre junto a competidores como Microsoft y OpenAI. En comparación, el modelo OpenAI apareció en más de 230 ejemplos, mientras que Google y Anthropic aparecieron cada uno docenas de veces.

Un patrón similar surgió en una base de datos de proyectos gubernamentales de IA más ambiciosos con un número menor de usuarios. Grok apareció sólo tres veces: dos para tareas administrativas de rutina en la Comisión de Asistencia Electoral y una vez en un ensayo del Departamento de Energía en el Laboratorio Nacional Lawrence Livermore para resúmenes de documentos e investigaciones generales. Reuters Encontré 140 entradas relacionadas con Microsoft y OpenAI, mientras que mi revisión rápida encontró al menos 10 entradas para Anthropic y docenas para Google Gemini.

La lista es una medida incompleta y desigual de la adopción gubernamental. Hay muchos más ejemplos enumerados sin proveedores específicos y está claro que no existe una definición universal de lo que se considera IA. Los datos tampoco cubren a las agencias de inteligencia ni al Pentágono, donde xAI recibió un contrato de 200 millones de dólares el año pasado y recientemente se le permitió operar en redes clasificadas después de que Anthropic fuera incluido en la lista negra.

Aun así, las cosas no pintan bien para Grok. Aparece con mucha menos frecuencia que sus competidores, y cuando lo hace, es principalmente para trabajo administrativo básico: difícilmente rival para el modelo de vanguardia de clase mundial del que Musk se ha jactado durante años.

“Simplemente no es el mejor modelo disponible”.

La persona con quien hablar Reuters sugiere que la explicación es simple: Grok no es tan bueno como sus competidores. “Simplemente no es el mejor modelo disponible”, dijo una fuente anónima del Pentágono, añadiendo que el personal tendía a preferir Gemini o Claude. Las tablas de clasificación públicas clasifican los modelos de IA da peso a esa opinión. Anthropic, Google y OpenAI dominan las primeras clasificaciones, mientras que Grok rara vez se ubica entre los 10 primeros fuera de las categorías de imagen o video.

Esto resulta incómodo para Musk, y aún más incómodo para SpaceX, que absorbió xAI a principios de este año. La salida a bolsa de la compañía de cohetes archivar muestra que la empresa ha puesto la IA (y Grok en particular) en el centro de su propuesta ante los inversores. SpaceX afirma haber identificado “el mercado accionable total más grande de la historia de la humanidad”: una increíble oportunidad de 28,5 billones de dólares, pero desafortunadamente, SpaceX no ha proporcionado un calendario firme para lograrlo. En la práctica, todas estas estimaciones de valor provienen de la IA, específicamente de la IA empresarial, no de cohetes o satélites.

Reuters señaló que el desempeño de Grok en agencias gubernamentales también podría proporcionar una pista de qué tan bien se desempeñaría en otros lugares de trabajo. Como parte de su impulso xAI para clientes empresariales, Musk ha hecho precisamente eso Según se informa, los bancos están armados fuerte. comprar la suscripción de Grok si quieren participar en la oferta pública inicial de SpaceX, pero si no obtienen la recompensa, este acuerdo podría ser una solución a corto plazo.

Como si el bajo rendimiento no fuera suficiente, Musk admitió recientemente que xAI había utilizado modelos OpenAI para ayudar a entrenar y mejorar a Grok. El proceso, llamado destilación, es estándar cuando las empresas utilizan sus propios modelos, pero es mucho más controvertido cuando implica utilizar el sistema de un competidor. Grok ni siquiera pudo vencer al modelo que entrenó.

En su versión pública para el consumidor, Grok es deliberadamente desagradable. Musk calificó el chatbot como una alternativa menos sesgada y menos censurada a herramientas como ChatGPT, pero esto se tradujo en un producto con estándares probatorios laxos, una obsesión enfermiza con Musk y un largo historial de naturaleza ofensiva, conspirativa y sexual. Incluso si las barreras de seguridad en el lugar de trabajo fueran diferentes, esto podría no ser aceptado por el mundo empresarial. El ilustre historial de Grok incluye elogiar a Adolf Hitler, arrojar dudas sobre el número de víctimas del Holocausto, difundir millones de falsificaciones sexuales no consensuales en todo el mundo, incluidos niños, y respaldar imitaciones racistas y transfóbicas de Wikipedia y novias mordaces de anime. Y no olvides cuando se hacía llamar “MechaHitler”. Si Grok fuera un empleado humano, no creo que RR.HH. tardara mucho en involucrarse.

SpaceX parece entender el problema. En su presentación, la compañía advirtió que el modo “picante” o “incontrolado” de Grok conlleva “mayores riesgos”, incluidos daños a la reputación, escrutinio regulatorio y demandas. En lenguaje corporativo: estos chatbots van a hacer que nos demanden.

En lenguaje corporativo: estos chatbots van a hacer que nos demanden.

Grok tomó su nombre de Robert A. Heinlein Extraños en una tierra extrañalo que a grandes rasgos significa una comprensión profunda y profunda de algo. Lo que hay que entender aquí no es tan complicado: Musk ha gastado miles de millones de dólares en construir un chatbot que no es muy bueno, no es muy popular y de alguna manera es clave para justificar la valoración astronómica de SpaceX. Buena suerte con eso.

Seguir temas y autores de esta historia para ver más cosas similares en su feed de inicio personalizado y recibir actualizaciones por correo electrónico.




Source link