Logo Computerhoy.com

La IA generativa de Alexa deja entrever un futuro prometedor para los asistentes digitales, pero está llena de retos

Alexa IA Generativa

Amazon

Computer Hoy ha tenido la oportunidad de charlar con Carlos Pérez, responsable de Alexa en América, sobre la nueva IA generativa que han incorporado a Alexa. Entre sus principales retos se encuentra el de ser concisa y "no alucinar" —como ChatGPT—, pero hay mucho futuro por delante.

Era cuestión de tiempo que los asistentes digitales se renovaran debido a la aparición de competidores tan fuertes como ChatGPT, de OpenAI, o Bard, de Google.

Desde principios de año, los asistentes digitales tradicionales estaban quedando en el olvido debido a la explosión de IA que estaba ocupando todas las conversaciones. De hecho, Amazon decidió hace unas semanas aportar un poco de viento fresco para que su futuro se viera más prometedor.

Durante su keynote anual de producto que tuvo lugar en Arlington, Virginia (EEUU) y a la que Computer Hoy tuvo la oportunidad de asistir, la compañía hizo una pequeña demo de IA generativa en la que Alexa demostraba no solo ser más inteligente, sino ser capaz de mantener una conversación fluida con el interlocutor en base a las respuestas y gustos del usuario.

En este sentido, una de las verdaderas ventajas del LLM (Large Language Model) que se le puede ver a este sistema es la posibilidad de no tener que estar nombrando continuamente al asistente de voz. Así, el comando "Alexa", quedará relegado solo a la primera frase que le quieras decir para activarla diciendo "Alexa, let's chat". A partir de ahí, podrás tener una conversación fluida.

Amazon Echo Show 8, primeras impresiones: Alexa cada vez es más inteligente y sostenible

"El desarrollo de esta IA no ha sido sencillo, llevamos más de 10 años enfocados en transformar la tecnología y hacer uso de la IA para que las experiencias que tenemos hoy en día se vuelvan más intuitivas ", comenta Carlos Pérez, responsable de Alexa en América, a Computer Hoy.

El directivo reconoce que lo que están haciendo actualmente es "complemente diferente" a lo que se estaba haciendo en la anterior década, ya que lo que buscan tiene que estar optimizado con la voz y las necesidades actuales. 

"Vemos gente que tiene 20 o 30 dispositivos en su casa y cada vez ese número crece más, por lo que además de tener un hardware dedicado había que desarrollar una Alexa más fluida, conversacional e inteligente", señala.

Los retos: el tono, respuestas concisas y las alucinaciones

Carlos Pérez, responsable de Amazon en America.
Carlos Pérez, responsable de Amazon en America.

Amazon

Tal y como confirma Pérez, había tres grandes retos cuando comenzaron con su desarrollo: el tono, las respuestas concisas y las alucinaciones. El primero de ellos se debe a que el propio asistente debe distinguir de forma natural qué clase de frase se le está preguntando y si es con un lenguaje feliz, irónico, triste o enfadado, entre otros. 

También es interesante tener el cuenta el miembro de la familia que está preguntando cosas: "No puede darte una respuesta igual, sobre todo en preguntas peliagudas como, ¿dónde vive Papá Noel?".

Por otro lado, es importante que te dé respuestas concisas: "No quieres que te contesten en ensayos de 30 minutos, los usuarios buscan respuestas correctas y cortas, es decir, que no alucine".

En este sentido, uno de los grandes retos es la confianza del usuario, pero también debe captar el tono de broma en otras ocasiones. "Todo irá evolucionando, pero esos serán los grandes retos", comenta.

"La idea es que te pueda dar ideas sobre una información o ayudarte a escribir mejor un email o una invitación. También sabe cuándo responderte, como por ejemplo si alguien te pregunta algo entre medias, y saber cuándo para: debe saber cuándo empezaste y terminaste de hablar", señala.

Además, comenta que, en caso de que lo necesites, las respuestas breves a preguntas tipo "Qué tiempo hace" o "Qué hora es", seguirán existiendo y no desaparecerán. "A veces Alexa no tiene por qué tener una respuesta con LLM involucrado, a veces no tendrá sentido". 

Su competencia no es ChatGPT: "Nuestra IA no puede 'alucinar'"

Está claro que Alexa se ha puesto las pilas —o se ha decidido lanzar al mercado de forma más inteligente— debido a la irrupción de ChatGPT y Bard, pero desde Amazon no lo ven como un gran competidor.

"Realmente lo que vemos en la industria está muy enfocado al navegador, y lo que nosotros queremos hacer es que pienses que estás hablando con otro humano. Además, nuestra IA no puede alucinar", advierte Pérez.

Lo cierto es que se ha demostrado en muchas ocasiones que cuando ChatGPT no sabe la respuesta o le falta información de alguna pregunta que le haces, acaba inventándosela, algo realmente conflictivo para los usuarios.

El futuro pasa por la personalización y la seguridad: los casos prácticos se encuentran en Fire TV

Otro de los puntos clave es la personalización. "Nos enfocamos más en que la personalización sea el entender tus gustos, en entender qué música te gusta, para que cuando pidas algo ambiguo se te ofrezca algo que tenga una gran probabilidad de agradarte, no algo completamente diferente o que no sea apropiado para tu lenguaje o simplemente contenido radicalmente opuesto a lo que sueles consumir", explica.

Así, lo más llamativo actualmente son los fondos ambientales de Fire TV 4K Max, que transforman tu televisor en una pantalla inteligente con tecnología de Alexa cuando no hay ninguna reproducción en streaming.

Historia de Amazon en España, de los libros y tecnología hasta la alimentación fresca

En un futuro, otra de las posibilidades que tendrá Alexa, será la de crear imágenes modificadas por IA a través de una muy concreta que te ofrezca el sistema. Por ejemplo, si hay un campo con flores, le podrás decir que añada tonos más cálidos o fríos, para crear un salvapantallas acorde con tus gustos.

De la misma forma, también será capaz de recomendarte contenidos similares a algo que estés buscando pero de lo que no te acuerdes del nombre.

Actualmente Amazon está trabajando con empresas como Xiaomi, iRobot, Philips y otras tantas para que puedan incorporar sus APIs y que su lenguaje se adapte al de Alexa, por lo que se espera un futuro muy prometedor.

Por otro lado, también señalan que sus productos son y serán muy seguros, respetando la privacidad de los usuarios en todo momento, con ejemplos tan claros como los botones físicos para apagar el micrófono de los dispositivos Echo.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.