DALL-E, la surrealista IA que genera imágenes a partir de frases
Open-AI una vez más es la responsable de una inteligencia artificial un tanto sorprendente. ¿Cómo sería un sillón con forma de aguacate?
DALL-E es una inteligencia artificial capaz de crear imágenes de gran realismo con las frases más extrañas. Habíamos visto a otras inteligencias artificiales crear cuadros o modificar fotografías, incluso inventarse personas con un realismo aterrador, pero este es un nuevo nivel.
Open-AI ha creado esta red neuronal como una versión de 12 mil millones de parámetros de GPT-3, otro de los grandes proyectos de esta organización de 2020. En vez de generar texto o escribir en lenguajes de programación, esta nueva red neuronal crea imágenes o dibujos a partir de leyendas de texto.
Con una sencilla descripción como "sillón en forma de aguacate" o "escaparate con la palabra Open-AI" esta inteligencia artificial crea imágenes de estilos muy diversos. Entre sus habilidades está la creación de versiones antropomorfizadas de animales y objetos, la combinación de conceptos no relacionados de manera plausible, la representación de texto y la aplicación de transformaciones a imágenes existentes.
GPT-3 demostró el año pasado que el lenguaje puede usarse para instruir a una gran red neuronal y que esta genere una amplia variedad de textos. Por otro lado, Imagen GPT, sirvió para entrar un mismo tipo de red neuronal para generar imágenes muy realistas. DALL-E sería la confluencias de ambos proyectos de investigación y desarrollo.
DALL-E es el acrónimo de WALL-E, el robot protagonista de Pixar, y Dalí, el pintor surrealista. Un guiño que ha querido dar esta organización a la combinación de tecnología y surrealismo artístico porque las imágenes creadas por esta inteligencia artificial son de lo más surrealista, aunque no lleguen al nivel de los cuadros del pintor. Quizás habría que pedirle a DALL-E que creará un teléfono langosta para ver cuál es su versión de esta obra.
Los investigadores reconocen que el resultado de estas creaciones depende en gran medida de la descripción que se le aporte a la red neuronal: "A medida que se introducen más objetos, Dall-E tiende a confundir las asociaciones entre los objetos y sus colores, y la tasa de éxito disminuye drásticamente". En su web, Open-AI permite que los visitantes jueguen con esta red neuronal y cambien los términos de esas frases para poner a prueba sus creaciones.
Aunque otras redes han probado con métodos similares, la importancia de DALL-E es su tamaño, sus parámetros y datos de entrenamiento, algo por lo que también sorprendió GPT-3 en su momento. "Es mucho más difícil encontrar una combinación de entradas que empuje a la red neuronal fuera de su "zona de confort", ha explicado en Twitter Mark Riedl, profesor e investigador de inteligencia artificial en Georgia Tech.
Conoce cómo trabajamos en ComputerHoy.