Ya no es posible evitar la IA generativa al interactuar con la tecnología, pero Apple ya la está reduciendo. Pero no es enteramente por elección. El fabricante de iPhone ha retrasado varias veces Siri mejorado con IA desde que lo prometió por primera vez en 2024, pero un acuerdo con Google combinará el asistente icónico con Gemini a finales de este año. A medida que nos acercamos Conferencia mundial de desarrolladoresApple ha estado trabajando para llevar inteligencia artificial masiva al entorno de procesamiento simple de los teléfonos inteligentes. Sin embargo, es posible que a los fanáticos de Apple no les gusten los resultados.
Apple ha hablado durante mucho tiempo sobre el valor de la privacidad de ejecutar la IA localmente, pero un nuevo informe sugiere que a pesar de los mejores esfuerzos de Apple, los cambios de Gemini en el iPhone dependerán en gran medida de Google y Nvidia en la nube. Información informe que Siri, compatible con Gemini de Apple, se ejecutará en dispositivos y en la nube, un marcado revés de las preferencias centradas en la privacidad para la IA local.
Con cada anuncio de un nuevo chip, escuchamos acerca de cómo el silicio se ha optimizado para la IA; incluso Apple lo está haciendo con su enfoque en mejorar el Neural Engine. Por el lenguaje grandilocuente, se podría pensar que los teléfonos inteligentes están equipados para manejar potentes modelos de IA, pero ese no es necesariamente el caso. De hecho, la GPU de la mayoría de los teléfonos puede procesar más tokens de IA que una NPU centrada en IA. Componentes como Neural Engine de Apple están diseñados para un procesamiento de IA contextual y eficiente. Aunque los teléfonos tienen un procesamiento de IA más rápido, carecen de RAM para almacenar modelos grandes en la memoria.
Incluso los modelos de IA más grandes siguen siendo asistentes de rango medio, y esto hace que la IA local sea un gran desafío. Los modelos de IA que se ejecutan en teléfonos son físicamente más pequeños y muestran como máximo unos pocos miles de millones de parámetros. Compárese eso con el último modelo Gemini de Google, que tiene billones de parámetros, informó The Information. El modelo de IA en el dispositivo también está “cuantificado” para ejecutarse con menor precisión, lo que lo hace más rápido pero afecta la precisión de la generación de tokens. Esto hace que la IA se sienta menos inteligente que su hermana en la nube, e incluso los grandes modelos basados en la nube pueden ser bastante estúpidos en ocasiones.
Géminis deslumbrante y encogido
Google tiene una versión de Gemini optimizada para dispositivos móviles, llamada Gemini Nano. Sin embargo, está diseñado para admitir funciones contextuales como Magic Cue y resúmenes de audio. Siri, por otro lado, se supone que es un asistente de conversación: le hablas y Siri hace las cosas. Es una experiencia diferente que requiere un modelo diferente. En Android, Google ni siquiera se molesta en intentar hacerlo localmente. Hablar con Gemini siempre va directo a la nube.



