Logo Computerhoy.com

SpeeChin, el dispositivo para dar órdenes de voz en silencio

SpeeChin, el dispositivo para dar órdenes de voz en silencio

Cornell University

¿Cómo puedes hablar con un asistente virtual si eres mudo, o estás en una biblioteca, o en una fábrica muy ruidosa? La solución se llama SpeeChin, y ha sido desarrollada por estudiantes universitarios.

Aunque no son del agrado de todo el mundo, los asistentes virtuales se utilizan en infinidad de tareas, ya sea a través del móvil, coches, altavoces inteligentes, dispositivos del hogar, etc.

Siri, Alexa, el Asistente de Google, etc., reciben órdenes a través de la voz. Pero esto tiene una limitación obvia: no puedes usarlo en un lugar en donde tengas que estar en silencio. O al contrario, en un lugar con mucho ruido. O por una persona muda, o que tenga problemas de voz.

Ruidong Zhang, un estudiante de informática de la Universidad de Cornell, en Estados Unidos, con ayuda del profesor asistente Cheng Zhang, ha desarrolladoSpeeChin, un dispositivo para dar órdenes de voz mudas. Puedes verlo en este vídeo:

SpeeChin sirve para dar órdenes de voz a un asistente virtual, sin emitir sonidos.

Se trata de una camara de infrarrojos colocada en un collar, y orientada para que apunte a la barbilla. Aunque su función es leer los labios, se coloca en la barbilla para no enfocar la cara, preservando así la privacidad.

Es más privada, pero eso hace que el reconocimiento de órdenes sea mucho más complicado.

SpeeChin emplea una inteligencia artificial que ha sido entrenada para reconocer órdenes de voz, por medio de los movimientos de la barbilla.

Análisis Amazon Echo 2020

Cuando pronunciamos una palabra, nuestra barbilla y nuestra nuez se mueven de forma diferente según las letras que componen dicha palabra.

La inteligencia artificial de SpeeChin ha analizado a 10 estudiantes que hablaban inglés, y otros diez estudiantes que hablaban chino, pronunciando las órdenes más comunes de Alexa y el Asistente de Google, en silencio.

Tras el entrenamiento, esta IA es capaz de reconocer 54 órdenes en inglés y 44 órdenes en chino, con un porcentaje de acierto del 90,5 y 91,6%, respectivamente. Solo con enfocar la cámara a la barbilla, sin ver la boca.

Funciona bien, pero tiene un hándicap: el porcentaje baja cuando la persona está en movimiento, porque la barbilla se mueve de forma diferente.

Es una tecnología interesante, porque es barata, sencilla de fabricar, y que respeta la privacidad. Puede ser muy útil en puestos de trabajo concretos en donde hay mucho ruido, o al contrario, en donde se exige un silencio total.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.