Logo Computerhoy.com

Microsoft mejora el sonido de videollamadas en Teams sintetizando el audio mediante IA

Tecnología
Microsoft Teams

El teletrabajo se ha convertido en una modalidad laboral inevitable. Ahorra dinero a la empresa, ahorra dinero al trabajador y todo el mundo deja de perder tiempo en atascos camino a la oficina. Para mejorar esta herramienta, Microsoft ha buscado ayuda en la inteligencia artificial.

Cuando hablamos de videollamadas solemos pensar en WhatsApp, Zoom o Skype. Pero la realidad es que hay muchas más apps para realizar estas tareas. Por ejemplo, el Microsoft Teams. La herramienta de Microsoft es usada por millones de personas y está a punto de mejorar.

Microsoft Teams es una de las herramientas de colaboración en línea más utilizadas del mundo, especialmente en aquellas empresas que practican el habitual modelo híbrido. Como tal, Microsoft realiza regularmente mejoras en el software, al tiempo que añade nuevas funciones.

Ahora, la firma ha detallado una nueva iniciativa impulsada por la inteligencia artificial (IA) para que las llamadas de Teams suenen mejor, especialmente en condiciones de red deficientes (que es lo habitual cuando funcionamos a través de redes WiFi).

Para quienes no lo sepan, el contenido de audio en una llamada de Teams se envía a través de lo que son esencialmente paquetes de datos. Y estos paquetes pueden perderse debido a una mala conectividad a Internet, lo que hace que el audio se distorsione. Esto sucede en todas las apps.

Cómo Microsoft ha mejorado las videollamadas: aprende Zoom

Si bien Microsoft no puede realmente arreglar tus problemas de conectividad a Internet, lo que hace en Teams es aprovechar una técnica llamada Ocultación de Pérdida de Paquetes (PLC) para hacer que tu voz suene mejor artificialmente en entornos de red difíciles.

A un nivel muy alto, PLC utiliza un modelo de IA para identificar los paquetes que faltan en tu transmisión de audio y luego rellenar cualquier vacío mediante predicciones.

Microsoft afirma que ha utilizado técnicas de aprendizaje profundo para lograr esta mejora. La compañía dice que, mientras que los modelos tradicionales pueden rellenar huecos de 20 a 40 milisegundos, su modelo PLC para Teams puede rellenar vacíos de audio de hasta 80 milisegundos.

Microsoft Teams

Aunque Microsoft ha entrenado su modelo PLC con 600 horas de datos de código abierto, lo fascinante es que también ha recogido "millones de muestras de red anónimas", o lo que denomina "rastros" de llamadas reales de Teams para probar su modelo. Tras el lanzamiento del modelo PLC, los participantes con malas condiciones de red informaron de una mejora de alrededor del 15%.

Microsoft ha subrayado que su modelo PLC de Teams se ejecuta completamente de forma local, y solo cuando hay una mala calidad de red. O Skype y Zoom se ponen las pilas, o Teams se va a convertir en la app de referencia para videollamadas.

Descubre más sobre autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.

Hoy destacamos

Y además