SpeeChin, el dispositivo para dar órdenes de voz en silencio
Cornell University
¿Cómo puedes hablar con un asistente virtual si eres mudo, o estás en una biblioteca, o en una fábrica muy ruidosa? La solución se llama SpeeChin, y ha sido desarrollada por estudiantes universitarios.
Aunque no son del agrado de todo el mundo, los asistentes virtuales se utilizan en infinidad de tareas, ya sea a través del móvil, coches, altavoces inteligentes, dispositivos del hogar, etc.
Siri, Alexa, el Asistente de Google, etc., reciben órdenes a través de la voz. Pero esto tiene una limitación obvia: no puedes usarlo en un lugar en donde tengas que estar en silencio. O al contrario, en un lugar con mucho ruido. O por una persona muda, o que tenga problemas de voz.
Ruidong Zhang, un estudiante de informática de la Universidad de Cornell, en Estados Unidos, con ayuda del profesor asistente Cheng Zhang, ha desarrolladoSpeeChin, un dispositivo para dar órdenes de voz mudas. Puedes verlo en este vídeo:
SpeeChin sirve para dar órdenes de voz a un asistente virtual, sin emitir sonidos.
Se trata de una camara de infrarrojos colocada en un collar, y orientada para que apunte a la barbilla. Aunque su función es leer los labios, se coloca en la barbilla para no enfocar la cara, preservando así la privacidad.
Es más privada, pero eso hace que el reconocimiento de órdenes sea mucho más complicado.
SpeeChin emplea una inteligencia artificial que ha sido entrenada para reconocer órdenes de voz, por medio de los movimientos de la barbilla.
Cuando pronunciamos una palabra, nuestra barbilla y nuestra nuez se mueven de forma diferente según las letras que componen dicha palabra.
La inteligencia artificial de SpeeChin ha analizado a 10 estudiantes que hablaban inglés, y otros diez estudiantes que hablaban chino, pronunciando las órdenes más comunes de Alexa y el Asistente de Google, en silencio.
Tras el entrenamiento, esta IA es capaz de reconocer 54 órdenes en inglés y 44 órdenes en chino, con un porcentaje de acierto del 90,5 y 91,6%, respectivamente. Solo con enfocar la cámara a la barbilla, sin ver la boca.
Funciona bien, pero tiene un hándicap: el porcentaje baja cuando la persona está en movimiento, porque la barbilla se mueve de forma diferente.
Es una tecnología interesante, porque es barata, sencilla de fabricar, y que respeta la privacidad. Puede ser muy útil en puestos de trabajo concretos en donde hay mucho ruido, o al contrario, en donde se exige un silencio total.
Otros artículos interesantes:
- Por fin podrás enseñar al Asistente de Google a pronunciar bien tu nombre
- Activa el modo Dios en tu Alexa y todo lo que puedes hacer con él
- Los altavoces inteligentes Amazon Echo ahora son capaces de detectar cuando entras a una habitación
- Nuevo Samsung Galaxy S24 Ultra: mejora la experiencia con la Inteligencia Artificial Galaxy AI
Descubre más sobre Juan Antonio Pascual Estapé, autor/a de este artículo.
Conoce cómo trabajamos en Computerhoy.