Logo Computerhoy.com

Google ya ha aprendido a leer los labios

Jakub Motyka

La inteligencia artificial de Google sabe leer los labios

La inteligencia artificial de Google, la misma que ha ganado a un humano en el juego de mesa Go, ahora es capaz de leer los labios de las personas. Puede saber lo que estás diciendo sin necesidad de escucharte.

Así lo ha anunciado Deepmind, la división de Google que se encarga de los proyectos relacionados con la inteligencia artificial (IA). En un trabajo conjunto con la Universidad de Oxford, la compañía ha conseguido que su software lea los labios de una persona con una mayor precisión que la de un especialista en esta técnica.

Para ser exactos, la tasa de acierto de la inteligencia artificial de Deepmind a la hora de leer los labios de una persona ha alcanzado el 46,8%. Puede parecer poco, pero un especialista en la lectura de labios no fue capaz de superar el 12,4% de acierto a la hora de interpretar las palabras de un presentador en exactamente el mismo vídeo sin sonido.

Tras derrotar al humano en un juego de mesa, Deepmind ahora va a por StarCraft II

El proyecto, llamado Watch, Listen, Attend and Spell, ha utilizado los programas de televisión más populares de Reino Unido como escenario para que la inteligencia artificial pudiera practicar el reconocimiento de los labios.

Más de 5.000 horas de televisión para aprender a leer los labios

Deepmind aprende a leer los labios

En total, el programa ha tenido que "ver" unas 5.000 horas de contenido de televisión de programas ingleses de la BBC como Newsnight (590 horas), World News (194 horas) o Question Time (323 horas). Todas estas horas de contenido han dejado tras de sí más de 110.000 frases diferentes que Deepmind, la inteligencia artificial de Google, ha tenido que descifrar solamente leyendo los labios de la persona que habla en cada frase.

La compañía señala que el proyecto ha sido un verdadero reto para la tecnología actual, y destaca ejemplos tales como -por ejemplo- el de la confusión que se produce incluso en los expertos de la materia a la hora de tener que leer los labios de una persona que pronuncia la letra "b" y la letra "p" en la misma frase o palabra.

Deepmind ha alcanzado una tasa de éxito bastante razonable leyendo los labios, y ahora falta por ver si Google será capaz de llevar a la práctica esta tecnología para, por ejemplo, facilitar la vida de las personas con algún tipo de problema de audición.

[Fuente: PDF del estudio | Vía: The Next Web]

Conoce cómo trabajamos en Computerhoy.