Logo Computerhoy.com

Make-A-Video es capaz de crear vídeos cortos desde texto con Meta AI: tú escribes y hace magia

video AI

Ya hemos visto cómo la IA está muy avanzada en labores como es la creación de imágenes con Dall-E 2 o Stable Diffusion. ¿Y si te dijéramos que existe una IA que hace lo mismo pero en lugar de una imagen, genera un vídeo?

Make-A-Video es un paper de Meta AI que pretende dar el siguiente paso hacia el futuro en la evolución de la Inteligencia Artificial. No solo genera un dibujo, sino que crea distintas imágenes y coloca una después de otra a modo de GIF o vídeo animado.

Hemos tenido acceso a Dall-E2 anteriormente así como también Stable Diffusion y hemos visto cómo, según el input de texto que introduzcamos, se generan imágenes nuevas y únicas. Ahora bien, ¿y si pudiéramos generar un vídeo

Pero antes de nada, ¿qué es un vídeo? Es una sucesión de imágenes a ritmo constante que tienen cierta correlación y representan el movimiento. Esto es lo que la Inteligencia Artificial de Facebook, Meta AI, es capaz de conseguir mediante Make-A-Video.  

Esta nueva tecnología permite, como podemos leer en su paper, crear un vídeo corto desde una entrada de texto, pero también puede hacer un vídeo desde dos imágenes o simplemente crear variaciones de un vídeo que subas.

Hay todavía cosas que resolver con las inteligencias artificiales, como es la propensión a distorsionar las manos o poner manos humanas en animales. Sin embargo, está claro que Facebook ha hecho un gran trabajo.

Cómo funciona esta inteligencia artificial

El entrenamiento de esta IA se ha realizado con vídeos públicos sin etiquetar según Meta AI por lo que podríamos estar hablando de que en el futuro podría haber problemas si no ha habido filtro inicial por temas de pornografía, etc.

Make-A-Video genera 16 frames a una resolución de 64 x 64 pixeles, es decir, minúscula y otra IA lo reescala hasta una resolución de 768 x 768 px lo que explica ese resultado que hemos visto en el vídeo anterior.

Estamos, como vemos, al trabajo conjunto de dos inteligencias artificiales una plenamente generacional desde su entrenamiento y otra que se encarga de reescalar el contenido hasta una resolución razonable. Es la primera vez que vemos este funcionamiento de encadenar procesos IA tan específicos.

De momento este servicio no es público, pero sí que puedes apuntarte para ser de los primeros en probarlo en su web.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.