Skip to main content

La app que lee texto con tu voz ha llegado, y funciona

Ordenador micrófono

Getty Images

19/07/2021 - 17:40

Descript, un programa para editar audio y vídeo de una forma cómoda y sencilla, cuenta con una función que resulta bastante inquietante: es capaz de leer texto con tu voz. Te contamos cómo funciona.

En los últimos años, las noticias relacionadas con los deepfakes se han convertido en algo muy común y a día de hoy gran parte de la población conoce el concepto. En ComputerHoy.com ya explicamos hace unos meses qué es un deepfake, señalando que es la "composición de los términos deep learning y fake, es decir: aprendizaje profundo, una de las ramas de la inteligencia artificial, y la palabra falso".

Aunque en los medios principalmente hemos visto vídeos que falsifican el rostro de las personas, esta tecnología se puede aplicar a la voz para, por ejemplo, llevar a cabo estafas telefónicas, y también es posible emplearla para falsear imágenes satelitales.

Pero esta tecnología no solo se utiliza para fines maliciosos, y la app Descript nos lo demuestra. Se trata de un programa que centraliza diversas herramientas de edición de audio y vídeo. Se puede descargar gratis desde la página oficial

Descript tiene unas funciones gratis y otras de pago. Una de las características a las que solo tienen acceso los suscriptores se llama Overdub y ofrece la posibilidad de clonar tu voz para que el programa pueda leer texto por ti. Los resultados son realmente sorprendentes y puedes ejemplos en este enlace. El youtuber Pat Flynn explica su funcionamiento en este vídeo:

Esta función está especialmente diseñada para agilizar el trabajo de los creadores de vídeo, podcasts u otro tipo de piezas, ya que pueden crear con rapidez locuciones o hacer correcciones con su propia voz con un resultado muy realista.

Para poder clonar una voz, en primer lugar el programa requiere que el usuario lea un consentimiento específico para asegurarse de que no se va a falsificar la voz de otra persona. Después se tiene que grabar leyendo unos textos determinados para entrenar a la IA. La clonación se irá haciendo más fiel a medida que vaya aumentando la muestra de voz de la que el sistema pueda aprender. 

La función Overdub de Descript puede ser muy útil para los creadores de contenido, pero la clonación de voz suscita una gran controversia. La última polémica relacionada con este tema saltó hace tan solo unos días. El pasado viernes se estrenó en Estados Unidos el documental del popular chef Anthony Bourdain, titulado Roadrunner: A Film About Anthony Bourdain. Su director, Morgan Neville, decidió recrear parte del discurso del chef mediante un software de clonación de voz, lo que ha vuelvo a abrir el debate acerca de los límites de esta tecnología. 

Tal como recoge AP News, Andrew Mason, fundador y director ejecutivo de Descript, afirma que "la clonación de voz no aprobada es una pendiente resbaladiza", y asegura que su compañía ha rechazado en repetidas ocasiones la solicitud de recuperar la voz de una persona fallecida.