Estás preparando una actualización regional o una reunión de equipo internacional en Google Meet, pero no todos hablan el mismo idioma. ¿Te suena?
Google Meet introdujo la traducción de voz con IA en mayo de 2025 durante su lanzamiento beta en Google I/O 2025, complementando así los subtítulos con IA existentes. Esta incorporación representa un avance significativo y una respuesta directa a la creciente demanda de traducción en tiempo real en las videollamadas cotidianas.
Pero esta nueva función aún está en su fase inicial y solo cubre un par de idiomas (inglés <> español). Por lo tanto, si está planeando una reunión importante, un foro multilingüe o el lanzamiento global de un producto, esta herramienta integrada podría no ser suficiente. Ahí es donde entran en juego los servicios de interpretación profesional y las soluciones lingüísticas externas como Interprefy , que le ofrecen la flexibilidad, el soporte y la calidad que necesita para conectar en distintos idiomas.
Antes de adelantarnos, exploremos lo que es posible actualmente y cómo puedes llevar la traducción en vivo en Google Meet aún más lejos.
más de 300 millones de personas utilizan Google Meet cada mes para videoconferencias, tanto personales como profesionales. Los anfitriones de sesiones multilingües de Google Meet tienen acceso a dos tipos principales de tecnología de traducción basada en IA:
Subtítulos con IA : Google Meet genera automáticamente subtítulos en tiempo real de lo que se dice en una reunión. Estos pueden aparecer en el mismo idioma que el orador o, según el plan y la configuración, traducirse automáticamente a otro idioma. Por ejemplo, si un orador habla en inglés, los participantes pueden elegir leer los subtítulos en español, francés o japonés. Esto ayuda a superar las diferencias lingüísticas y hace que las reuniones sean más accesibles para todos.
Google Meet solo admite la interpretación simultánea remota mediante extensiones de Chrome o servicios de interpretación profesionales como Interprefy . Sin embargo, hace tan solo un mes, el 20 de mayo de 2025, introdujo la traducción de voz con IA, lo que permite a los participantes traducir sus palabras a otro idioma casi en tiempo real. Esta función está disponible en versión beta para consumidores y se prevé su lanzamiento para usuarios empresariales a finales de 2025.
Esta nueva función utiliza la IA Gemini de Google para escuchar la voz del hablante, traducir sus palabras y reproducir la traducción con una voz sintética que imita fielmente el tono, el ritmo y la cadencia del hablante. Se escucha un leve eco del discurso original, lo que hace que la conversación parezca más natural. Hay un ligero retraso, normalmente de unos segundos, mientras la traducción se procesa en tiempo real.
La traducción de voz con IA está disponible actualmente para los usuarios suscritos a los planes Google Workspace AI Pro y AI Ultra. Solo un participante de la reunión necesita tener el plan activo; la traducción funciona para todos los demás asistentes, incluidos los que tienen cuentas gratuitas de Google Meet.
En el lanzamiento, la función admite traducción de voz de inglés a español. Se espera que próximamente se incorporen más combinaciones de idiomas, como italiano, alemán y portugués.
Durante una llamada, un usuario con un plan elegible puede abrir la herramienta "Traducción de voz" desde el menú de la reunión. Selecciona el idioma de la conversación y el idioma al que se traducirá. Una vez activada, los participantes escuchan la voz traducida en lugar del audio original. La voz original se escucha ligeramente de fondo para mantener el contexto.
La introducción de la traducción de voz mediante IA en las videoconferencias convencionales, como Google Meet, refleja una tendencia más amplia del sector hacia la comunicación multilingüe como parte fundamental de la planificación y ejecución de eventos. A medida que los eventos virtuales e híbridos se globalizan, aumenta la presión sobre los organizadores para que el contenido sea accesible a públicos que hablan diferentes idiomas.
La traducción de voz con IA representa una forma en que la tecnología lingüística está evolucionando para satisfacer esta necesidad, especialmente útil para la entrega directa de contenido o cuando los plazos o los recursos son limitados. Su inclusión en plataformas ampliamente utilizadas demuestra cómo el soporte lingüístico en tiempo real se está volviendo más accesible para una gama más amplia de organizadores y asistentes.
La función de subtítulos de Google Meet transcribe automáticamente el lenguaje hablado durante una reunión y lo muestra como texto en pantalla en tiempo real. Según el plan del usuario, los subtítulos pueden aparecer en el idioma original o traducirse instantáneamente al idioma de destino seleccionado.
Cualquier participante de la reunión puede activar los subtítulos en vivo. Al activarlos, Meet transcribe automáticamente el idioma hablado y muestra los subtítulos en pantalla. Esto puede ser especialmente útil para participantes en entornos ruidosos o con dificultades auditivas.
Los participantes pueden activar esta función haciendo clic en Más > Configuración > Subtítulos y seleccionando el idioma. Los subtítulos aparecen en la parte inferior de la pantalla y se desplazan automáticamente en tiempo real.
Para los usuarios de Google Workspace con planes compatibles, como Business Plus, Enterprise Standard, Education Plus y ediciones compatibles con Gemini, Meet ofrece la posibilidad de traducir los subtítulos a otros idiomas. Al activar esta función, se detecta el idioma hablado y los subtítulos se muestran automáticamente en el idioma de destino seleccionado.
Por ejemplo, un orador que presenta en inglés puede ser entendido por un participante que lee subtítulos en alemán, japonés o portugués. Todo esto sucede en tiempo real mediante traducción con tecnología de IA.
A partir de junio de 2025, los subtítulos opcionales son compatibles con más de 80 idiomas, aunque algunos aún están en fase beta y podrían no estar disponibles para todos los usuarios o estar sujetos a mejoras continuas. Los subtítulos admiten más de 4600 pares de idiomas (combinaciones de traducción) para los usuarios con acceso a Gemini para Google Workspace u otros planes que cumplan los requisitos .
Para mejorar la legibilidad, Google Meet también permite a los participantes personalizar la apariencia de los subtítulos. Los usuarios pueden ajustar el tamaño de la fuente, el color del texto y el fondo para adaptarlos a sus preferencias de accesibilidad. Estas actualizaciones de estilo estuvieron disponibles globalmente a mediados de 2024.
Si bien Google Meet ha logrado un progreso impresionante con la traducción en vivo impulsada por IA, aún existen algunas limitaciones clave a tener en cuenta, especialmente si está planeando un evento multilingüe con participantes diversos o contenido complejo.
A diferencia de otras plataformas como Zoom o Microsoft Teams, Google Meet no ofrece de forma nativa canales de interpretación simultánea remota (RSI) como sí lo hacen las plataformas de conferencias especializadas, lo que significa que no ofrece canales de audio separados para intérpretes y oyentes . No existe una forma integrada de conectar intérpretes humanos a una reunión ni de ofrecer múltiples canales de audio para que los participantes seleccionen. Esto puede suponer un reto para los organizadores que requieren interpretación en directo de intérpretes profesionales en varios idiomas.
Para la interpretación simultánea profesional (donde un intérprete humano escucha y habla en tiempo real), muchas organizaciones utilizan plataformas de terceros (como Interprefy ) junto con Google Meet. Estas plataformas se conectan con Google Meet para ofrecer transmisiones de audio independientes para intérpretes y asistentes, pero esta no es una función integrada en Google Meet.
Artículos relacionados:
La nueva traducción de voz con inteligencia artificial de Google Meet, lanzada en mayo de 2025, introduce avances notables en la accesibilidad del lenguaje en vivo, pero también presenta varias limitaciones en su forma actual.
Para empezar, la compatibilidad con idiomas es limitada. La traducción de voz en tiempo real actualmente solo está disponible entre inglés y español. Google ha anunciado planes para ampliar la compatibilidad a italiano, alemán y portugués en las próximas semanas. Si bien funciones relacionadas, como los subtítulos traducidos, son compatibles con más de 69 idiomas, la función de traducción hablada con IA sigue siendo mucho más limitada en cuanto a combinaciones de idiomas.
El acceso a esta función está limitado a los usuarios suscritos a los planes Google Workspace AI Pro y AI Ultra. No está disponible para los usuarios gratuitos, y se espera una implementación más amplia para los clientes empresariales y estándar de Workspace a finales de 2025. Este muro de pago puede suponer un desafío para los usuarios u organizaciones sin acceso a suscripciones premium, lo que podría limitar la inclusión.
Dado que la función aún está en fase beta, los usuarios podrían experimentar problemas ocasionales, como errores menores o inconsistencias en la calidad de la traducción. También puede haber una ligera latencia entre el texto original y la traducción, aunque Google informa que este retraso es mínimo y, por lo general, permite una conversación fluida.
Un aspecto clave de la traducción de voz con IA es su intento de replicar el tono, el ritmo y la expresión vocal del hablante mediante la generación de voz sintética. Sin embargo, esta recreación de voz no siempre capta elementos emocionales o culturales más sutiles, especialmente en conversaciones complejas.
En resumen, si bien la traducción de voz con IA de Google Meet ofrece capacidades prometedoras, sigue limitada por su limitada compatibilidad con idiomas, los requisitos de suscripción y su estado beta. Se espera que futuras actualizaciones aborden algunas de estas limitaciones a medida que la tecnología evolucione y se implemente un acceso más amplio.
En este momento, Google Meet no admite grabaciones con voz traducida por IA. La nueva función de traducción de voz por IA permite a los participantes escuchar traducciones habladas en tiempo real durante una reunión, pero estas transmisiones de audio traducidas no se guardan en la grabación oficial de la reunión. Por lo tanto, la grabación solo refleja el contenido hablado original.
Los organizadores que necesitan grabaciones con audio traducido necesitan actualmente herramientas de terceros. Esto podría implicar el posprocesamiento del audio original mediante tecnologías de voz a texto y texto a voz para generar pistas de voz traducidas, una función que no está disponible de forma nativa en Google Meet.
En cuanto al soporte multilingüe, Google Meet actualmente ofrece asistencia limitada más allá de las propias funciones automatizadas. No existe un proceso de soporte específico para garantizar que los subtítulos o la traducción de voz con IA estén configurados correctamente o funcionen como se espera. Si se produce un fallo, como que los subtítulos no aparezcan o que la traducción de voz no se active, los organizadores deben solucionarlo por sí mismos, a menudo sin soporte técnico en tiempo real. Además, no hay comprobaciones previas al evento, asistencia para la incorporación ni monitorización en directo de eventos específicos para las funciones multilingües. En eventos donde el acceso al idioma es fundamental, esta falta de soporte proactivo y receptivo puede suponer un riesgo para la experiencia de los asistentes y el éxito general de la reunión.
Las herramientas de subtítulos y traducción de voz impulsadas por IA de Google Meet son una base sólida para que las reuniones sean más accesibles, pero para muchos tipos de eventos, no cubren todo.
Cuando la precisión, los matices y la fiabilidad son importantes, las organizaciones suelen recurrir a servicios profesionales de interpretación para cubrir las necesidades. Esto se aplica especialmente, entre otros, a:
Eventos a gran escala con audiencias globales
Mesas redondas en varios idiomas donde la conversación de ida y vuelta es esencial
Reuniones con contenido técnico, legal o de cumplimiento normativo
Eventos que requieren grabaciones multilingües o materiales posteriores al evento
Configuraciones híbridas que combinan participantes en línea y presenciales
Un socio de interpretación profesional puede respaldar todas las fases de su evento, desde la búsqueda de intérpretes y la prueba de la configuración hasta la gestión de funciones para transferencias en vivo entre intérpretes y la garantía de que los participantes reciban el audio o los subtítulos correctos en el momento adecuado.
Si bien Google Meet no ofrece soporte integrado para interpretación simultánea remota, existen formas flexibles de ampliar sus capacidades multilingües utilizando herramientas externas, sin interrumpir la experiencia de la reunión.
Muchos proveedores de servicios lingüísticos profesionales ofrecen ahora soluciones que funcionan en paralelo con Google Meet. Estas configuraciones permiten a los organizadores incorporar interpretación humana y traducción de voz con IA en sus reuniones mediante interfaces complementarias o herramientas basadas en navegador.
Así es como funciona normalmente:
El audio original de la reunión se envía de forma segura a intérpretes profesionales o a un motor de traducción de voz con inteligencia artificial.
Los intérpretes humanos escuchan la reunión y brindan una interpretación en tiempo real desde una consola remota, o la IA genera una voz traducida utilizando tecnología de voz sintética con soporte ampliado para pares de idiomas.
Los participantes pueden acceder al audio traducido a través de una pestaña del navegador o una aplicación móvil, mientras continúan siguiendo la reunión en Google Meet.
También se pueden ofrecer subtítulos multilingües en vivo en paralelo, para ayudar a los usuarios que prefieren o necesitan leer en lugar de escuchar.
Esta configuración permite incorporar compatibilidad con idiomas avanzados en Google Meet sin cambiar de plataforma ni pedir a los asistentes que instalen nada. Es especialmente útil para organizadores que necesitan admitir más combinaciones de idiomas, idiomas poco comunes, contenido técnico o una alta participación de audiencias internacionales.
Ya sea una llamada de liderazgo, una sesión de capacitación o un evento híbrido multilingüe, estas soluciones externas ayudan a cerrar la brecha, agregando soporte escalable de voz y subtítulos a lo que Google Meet ya ofrece.
Si bien Google Meet ofrece útiles funciones de traducción integradas, los organizadores suelen necesitar mayor flexibilidad, control y cobertura lingüística, especialmente para eventos de alto perfil o multilingües. Interprefy soluciona estas deficiencias integrándose a la perfección con Google Meet para ofrecer servicios de traducción en vivo de calidad profesional.
Interpretación simultánea remota en tiempo real y traducción de voz con IA en más de 6000 combinaciones de idiomas, impartidas por intérpretes profesionales o motores de traducción de voz con IA. Los participantes pueden escuchar el audio traducido a través de una pestaña complementaria del navegador, una aplicación móvil o un reproductor integrado, sin tener que abandonar la reunión.
subtítulos multilingües en vivo , impulsados por IA y mejorados con la función de vocabulario personalizado de Interprefy para mejorar la precisión de la terminología, los nombres y las siglas específicos del evento.
Interprefy permite que Google Meet escale mucho más allá de sus capacidades nativas, ofreciendo traducción en vivo de nivel profesional sin pedir a los usuarios que cambien su forma de conectarse.
Google Meet continúa evolucionando como plataforma de comunicación global, con actualizaciones recientes como la traducción de voz mediante IA, que amplía lo que es posible en las reuniones multilingües.
Para las conversaciones cotidianas, estas funciones integradas pueden ser muy útiles. Sin embargo, para eventos profesionales, de alto nivel o complejos, a menudo es necesario complementarlas.
Actualmente, Google Meet no cuenta con interpretación simultánea remota integrada, y la traducción de voz mediante IA, si bien es prometedora, aún tiene cobertura de idiomas, compatibilidad de plataformas y capacidades de grabación limitadas.
Por eso, muchas organizaciones recurren a soporte externo para ofrecer experiencias de traducción en vivo realmente fluidas. Al combinar las ventajas de Google Meet con servicios de interpretación profesional, herramientas de traducción de voz con IA y subtítulos multilingües en tiempo real, es posible crear reuniones claras, inclusivas, compatibles y accesibles a nivel mundial, sin importar el número de idiomas involucrados.