Logo Computerhoy.com

Google señala el reconocimiento de voz como el próximo salto tecnológico

Lista con todos los comandos de voz de OK, Google (2018)

Dentro de la inversión que la industria tecnológica está realizando en sistema basados en inteligencia artificial, la conducción autónoma y la robótica son los que más titulares están protagonizando, sin embargo hay otro ámbito que aunque pase más desapercibido muchos expertos señalan como el próximo gran objetivo del futuro tecnológico. Se trata de los avances en servicios por reconocimiento por voz

ComScore asegura que en el año 2020, la mitad de las búsquedas en Internet se realizarán mediante el servicio de voz. Y esta es la misma predicción que ha defendido para The Guardian el jefe de búsqueda de Google, Ben Gomes, en una entrevista con motivo del aniversario de la compañía

Gomes explica que los sistemas de reconocimiento de voz se han vuelto esenciales en países en desarrollo, cuyas tasas de alfabetización son muy bajas como la India, país del que él procede. "Estudié hindi durante 10 años, pero no sabría cómo escribirlo, por lo que la voz es mucho más fácil de usar que la mecanografía" ha declarado para el medio británico. 

Google Assistant es más inteligente que todos sus rivales

El ser humano es capaz de decir aproximadamente 150 palabras por minuto, mientras que en ese tiempo solo llegamos a escribir unas 40 palabras. Aunque en Internet haya primado hasta ahora la palabra escrita, las tendencias actuales sugieren que el futuro podría ser muy diferente. 

La historia de esta tecnología se remonta hasta 1784, cuando Wolfgang von Kempelen creó el sintetizador de voz manual. Un siglo más tarde, Thomas Edison inventaría el dictáfono que, junto con otros dispositivos como el IBM Shoebox de 1962 capaz de reconocer hasta 16 palabras básicas del inglés, sentaron las bases sobre las que ahora se sustentan los modernos sistemas de reconocimiento de voz.

No fue hasta hace apenas 10 años cuando las grandes compañías tecnológicas empezaron a lanzar sus asistentes virtuales basados en los avances en reconocimiento de voz. El de Google está presente en más del 50% de móviles de todo el mundo, aunque Siri de Apple, Cortana de Microsoft y Alexa de Amazon, luchan con fuerza por el puesto número uno. 

El siguiente paso de esta tecnología y en el que se están enfocando todos, es en el conocimiento y entendimiento de los muchos significados que puede soportar una frase y la gran variedad de palabras que podemos usar para transmitir un mismo mensaje o significado. Es esa riqueza lingüística la que le sigue costando quebraderos de cabeza a estos sistemas inteligentes. 

"Las personas usan un lenguaje determinado cuando entienden de un tema y otro cuando no lo hacen" explica Gomes. En vez de buscar el contenido a raíz de las palabras exactas usadas por el usuario, el sistema debería ser capaz de buscar un rango más amplio de sinónimos y conocer la terminología específica de esa temática. Ese avance, explica The Guardian, le ha costado a Google cinco años. 

Lista con todos los comandos de voz de OK Google

Otro obstáculo a superar serían las referencias como "él", "ella", "eso" en las oraciones. En definitiva queda aún mucho por estudiar hasta conseguir hablar con una máquina con la misma fluidez que con otra persona. 

Aunque el uso de la voz sigue primando en las interacciones con los dispositivos móviles esta opción ya está disponible en otros dispositivos, desde PCs hasta altavoces inteligentes que se están convirtiendo en el corazón de los hogares haciendo de punto de unión entre todos los dispositivos conectados que tenemos en casa. 

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.