Google mejora la calidad de audio de las videollamadas en Google Duo

Las llamadas en línea se han convertido en una parte cotidiana de la vida de millones de personas al ayudar a racionalizar su trabajo y conectarlos con sus seres queridos. Para transmitir una llamada a través de Internet, los datos de las llamadas se dividen en fragmentos cortos, llamados paquetes. Estos paquetes se abren paso a través de la red desde el emisor hasta el receptor, donde se vuelven a ensamblar para hacer transmisiones continuas de video y audio. Sin embargo, los paquetes a menudo llegan al otro extremo en el orden incorrecto o en el momento incorrecto, un problema generalmente conocido como jitter, y a veces los paquetes individuales se pueden perder por completo. Problemas como estos conducen a una menor calidad de la llamada, ya que el receptor tiene que tratar de llenar los vacíos, y son un problema generalizado para la transmisión de audio y video. Por ejemplo, el 99% de las llamadas de Google Duo deben lidiar con pérdidas de paquetes, fluctuaciones excesivas o retrasos en la red. De esas llamadas, el 20% pierde más del 3% de la duración total del audio debido a problemas de red, y el 10% de las llamadas pierde más del 8%.
Google trabaja en un sistema basado en aprendizaje automático para mejorar la calidad del audio en las llamadas ‘online’ que se realizan con el servicio Google Duo, ya disponible en Pixel 4 y que pronto llegará a más modelos.
Cuando se hace una videollamada, los datos se dividen en paquetes, que se envían a través de la Red desde el emisor hasta el receptor, “donde se vuelven a ensamblar para hacer transmisiones continuas de video y audio”, como explica Google.
Sin embargo, en esa comunicación, algunos paquetes individuales llegan en el orden incorrecto o incluso se pierden por completo. Se trata de problemas que afectan a la calidad de la videollamada y, en el caso de Duo, afecta al 99 por ciento de las llamadas, como detalla la compañía en una publicación en su blog oficial.
Introducing WaveNetEQ, a new system for Google Duo that smoothly masks short breaks in the data stream to provide state-of-the-art, natural sounding audio, even with a poor connection. Learn how it works ↓ https://t.co/C4KDEkljAh
— Google AI (@GoogleAI) April 1, 2020
De esas llamadas, el 20 por ciento pierde más del 3 por ciento de la duración total del audio debido a problemas de Red, y el 10 por ciento de las mismas llega a perder más del 8 por ciento. Por ello, Google ha anunciado el uso de un sistema basado en aprendizaje automático para mejorar la calidad del audio de las llamadas ‘online’.
La compañía ha desarrollado WaveNetEQ, un sistema de ocultación de pérdida de paquetes, que utiliza un gran conjunto de datos de voz para entrenarse y poder continuar “de manera realista” segmentos cortos de voz.
Google explica que las llamadas de Duo están encriptadas de extremo a extremo, y por ello el procesamiento se realiza en el dispositivo. En este sento, El WaveNetEQ es “lo suficientemente rápido como para ejecutarse en un teléfono”, y proporcionar “una calidad de audio de vanguardia y un PLC de sonido más natural”.
Esta tecnología está ya disponible en los dispositivos Pixel 4 y empezará a llegar a más modelos.
Find out more about how we collaborated with @GoogleAI to improve the user audio call experience in @GoogleDuoApp, by introducing a new Packet Loss Concealment module based on WaveNet https://t.co/0376sPVoJz
— DeepMind (@DeepMind) April 1, 2020