Google ha estado buscando la traducción en tiempo real durante años, en lo que dice es uno de sus “experimentos pioneros de aprendizaje automático”. Hemos visto muchas demostraciones sobre las etapas de eventos de Google en el pasado, pero necesitarás un teléfono, audífonos o alguna otra configuración especial de Google. El año pasado, Google llevó la traducción en tiempo real a más usuarios en la aplicación Traductor y ahora Google está ampliando aún más su disponibilidad. Con el lanzamiento de Gemini 3.5 Live Translate, tendrás acceso a traducción instantánea en más lugares y con menor latencia que nunca.
Este nuevo modelo de IA forma parte de la familia de la versión 3.5 lanzada en I/O. Anteriormente, Google sólo lanzaba la versión Flash, pero esperamos que el modelo Pro se lance en las próximas semanas. Gemini 3.5 Live Translate es un modelo de voz a voz optimizado para detectar y traducir automáticamente en más de 70 idiomas.
Google dijo Gemini 3.5 Live Translate es lo suficientemente rápido como para mantenerse al día con una conversación normal, siguiendo solo unos segundos detrás del hablante y al mismo tiempo igualando la entonación, el tempo y el tono. En resumen, suena más a ti que a un típico robot. Las demostraciones, todas grabadas en condiciones controladas, suenan impresionantes. Sin embargo, no tendrá que esperar mucho para verificar usted mismo las capacidades del modelo.
Traducción de voz en Google Meet con Gemini 3.5 Live Translate.
Gemini 3.5 Live Translate se está implementando en partes del ecosistema de Google. Los desarrolladores pueden comenzar a construir con la vista previa pública en Gemini Live API o AI Studio. Este modelo procesa la voz de forma continua y maneja todas las entradas multilingües automáticamente, por lo que los desarrolladores no tienen que configurar los ajustes manualmente. También filtra el ruido de fondo en entornos concurridos.



