Skip to main content

Así funciona Imagen, la IA de Google que dibuja de forma realista lo que describes en texto

Así funciona Imagen, la IA de Google que dibuja de forma realista lo que describes en texto

24/05/2022 - 10:03

Las inteligencias artificiales que encontramos en Google y que con tan solo cuatro frases o palabras son capaces de generar una imagen, están causando furor. Hoy os traemos una novedad, Imagen, una aplicación con un fotorrealismo increíble.

La inteligencia artificial poco a poco sigue escalando puestos y cada vez es más conocida por el amplio público. Su rápido crecimiento y su alto rango de posibilidades hacen que muchas empresas inviertan mucho tiempo, dinero y trabajo en desarrollarlas.

No es la primera vez que hablamos sobre arte generado por inteligencias artificiales, y definitivamente no será la última. Ya nos adentramos en los mundos de Wombo.art, que nos permitió con tan solo una frase y un estilo artístico generar toda una obra de arte

También hablamos de Speech2Face, un algoritmo capaz de reconstruir el rostro de una persona utilizando sólo una primera grabación de audio de esa persona hablando. Y cómo no, DALL-E 2, que sigue causando furor en redes sociales y que genera imágenes basadas en texto.

En este artículo venimos a hablar de Imagen, la propia versión que ha hecho Google, que combina un profundo nivel de comprensión del lenguaje con un grado de fotorrealismo nunca antes visto. Bien es cierto, que si accedes a la web no vas a poder probarlo, al menos por el momento.

Imagen se basa en la potencia de los modelos de lenguaje de grandes transformadores en la comprensión del texto y se apoya en la fuerza de estos para la generación de imágenes de alta fidelidad. 

Por otra parte, llegaron a la conclusión de que pese a la dificultad que muchos evaluadores pusieron a la inteligencia artificial, como relaciones espaciales, texto largo,  palabras raras o peticiones desafiantes, esta seguía generando la misma calidad y acierto de imagen.

"Imagen pueden suponer un enorme paso para combinar la creatividad humana e informática", explica Jess Dean, jefe de IA de Google. Además, supera con creces lo que ya hemos visto anteriormente con DALL-E 2.

En cuanto al impacto social, Google ha decidido no publicar el código o una demostración pública de Imagen en este momento, dado el posible mal uso. Pese a eso, el documento de investigación está disponible aquí.

Y además