Zoom como Teams cuentan con una atractiva función que permite a los asistentes a las reuniones activar los subtítulos . Esta herramienta proporciona a los usuarios una valiosa asistencia visual para seguir las sesiones, ya que crea automáticamente una transcripción en vivo de lo que se dice.
Tanto Teams como Zoom utilizan algoritmos de reconocimiento de voz automatizados para transcribir el discurso en tiempo real. Estos algoritmos son completamente automáticos y requieren poca o ninguna preparación por parte del anfitrión de la reunión.
¿Qué tan precisos son los subtítulos de Zoom?
Zoom ofrece dos maneras de añadir subtítulos a sus reuniones y seminarios web. En las reuniones, el anfitrión puede asignar subtítulos manuales a un invitado mediante un proveedor externo de subtítulos integrado. Zoom también cuenta con una función de subtítulos automáticos que se puede activar y desactivar sin necesidad de intervención del anfitrión.
Se estima que los subtítulos automáticos de Zoom ofrecen una precisión de alrededor del 80 % .
¿Qué tan precisos son los subtítulos de Teams?
Los usuarios pueden activar subtítulos en vivo durante de Microsoft Teams , que se muestran justo debajo de la señal de video. Las investigaciones sugieren que estos subtítulos pueden alcanzar una precisión del 85% al 90% .
Dónde fallan los motores de conversión de voz a texto estándar
Ambas plataformas ofrecen subtítulos de suficiente calidad para facilitar la comprensión del texto. Sin embargo, la mayoría de los sistemas de reconocimiento de voz automático fallan cuando los hablantes usan palabras o frases poco comunes. Por ejemplo, marcas distintivas o nombres menos populares con grafías alternativas.
Los motores de conversión de voz a texto basados en IA son predictivos por naturaleza. Si un término no está en un diccionario estándar y no se usa con frecuencia o no se usa en absoluto en conversaciones informales, los motores no lo anticiparán en sus sesiones.
Artículo recomendado
¿Sabías que el 80% de los suscriptores de Netflix utilizan subtítulos regularmente?
Descubre 5 datos sorprendentes sobre los subtítulos →
Cómo la optimización del motor puede aumentar la calidad
Los sistemas de subtítulos impulsados por IA más avanzados, como Interprefy Captions , se pueden adaptar para incluir palabras y frases significativas y poco comunes que los motores normales pasarían por alto.
Esto se logra personalizando el sistema para incluir palabras clave que sean importantes para su sesión.
Al introducir previamente estos términos en el sistema, el sistema estará al tanto de su existencia, podrá detectarlos y transcribirlos correctamente cuando surjan durante una sesión.
Los siguientes son ejemplos de términos que los sistemas de conversión de voz a texto suelen pasar por alto:
- Nombres de personas, oradores, personas clave de la organización o del campo.
- Nombres de tecnologías, productos o servicios
- Nombres de marca
- Siglas y abreviaturas
- Términos poco comunes como expresiones técnicas, términos especializados o jerga.
Comparación de la calidad de los subtítulos
Probemos los motores ahora mismo. Usando los subtítulos automáticos para la misma declaración en Teams, Zoom e Interprefy, comparamos los tres métodos en paralelo.
Imagine una empresa llamada "Bravocado". Bravocado planea celebrar una asamblea general para presentar a su nuevo director ejecutivo, Aleks Ritchie, y lanzar su último producto, el FRT 420.
Lo que sigue son las transcripciones de los comentarios de apertura en MS Teams, Zoom e Interprefy.
|
Guión original Hola y bienvenidos al Foro de Bravocado. En un minuto, conoceremos a nuestro nuevo director ejecutivo, Aleks Richie, y también les contaremos sobre el próximo lanzamiento del FRT 420. |
Los siguientes son términos importantes que son relevantes para el evento pero que los motores de IA no suelen identificar:
- Bravocado
- Alex Richie
- FRT 420
Examinemos ahora los subtítulos que se muestran en cada plataforma durante una reunión con exactamente las mismas frases habladas.
Salida de subtítulos de Microsoft Teams
Microsoft Teams será nuestra primera parada. Las mismas palabras anteriores se pronunciaron en voz alta y clara durante una reunión de Microsoft Teams con la opción de subtítulos automáticos activada.
Este es el resultado:

Como podemos ver, el motor de Microsoft proporcionó suficiente calidad para obtener una comprensión, pero perdió las tres palabras clave importantes.
| Término original | Salida de los equipos | |
| Bravocado | → | Bravata |
| Alex Richie | → | Alex Ritchie |
| FRT-420 | → | FT-420 |
Salida de subtítulos de zoom
Ahora exploremos la función de subtítulos de Zoom. Seguimos el mismo procedimiento: nos unimos a una reunión de Zoom, activamos los subtítulos y pronunciamos las palabras con claridad y en voz alta.
Este es el resultado:

Los resultados de Zoom variaron ligeramente de los de Teams. La puntuación y la estructura de las oraciones son ligeramente incorrectas, y Zoom también identificó mal algunos términos clave.
| Término original | Salida de zoom | |
| Bravocado | → | bravoado |
| Alex Richie | → | Alex Ritchie |
| FRT-420 | → | Frente 420 |
Interpretar la salida de subtítulos con optimización del motor
Mientras que Zoom y Teams entregan automáticamente resultados sin procesar basados en sus datos de entrenamiento habituales, Interprefy va un paso más allá al optimizar el motor de voz a texto. Esto se logra mejorando el sistema con términos clave únicos y extremadamente relevantes para la sesión.
Este fue el resultado:
Como podemos ver, los tres términos clave fueron capturados con precisión por el sistema de subtítulos de Interprefy, después de optimizar el motor.
En resumen

Los motores de IA estándar pueden proporcionar subtítulos útiles para obtener una idea general de lo que se está diciendo. En nuestro experimento, demostramos que si los sistemas no estaban preparados para prestar especial atención a la terminología específica, todos omitían las tres palabras principales que buscábamos.
Si basta con "suficientemente bueno", los subtítulos de Zoom y Teams pueden ser una opción viable para proporcionar a los usuarios una herramienta que les ayude a comprender el tema. Sin embargo, dependiendo del contexto y la relevancia del evento, adoptar un sistema que casi con seguridad escribirá mal frases cruciales puede ser una decisión arriesgada.
Los sistemas de subtítulos especializados como Interprefy Captions pueden ayudarte a mejorar la precisión más allá del estándar. Y lo mejor es que puedes añadirlos a tus seminarios web de Zoom, reuniones de Teams o cualquier otra plataforma de reuniones que uses, para que puedas llevar tu experiencia de subtítulos al siguiente nivel dondequiera que estés.



Más enlaces de descarga



