Skip to main content

Inteligencia artificial permite hacer vídeos del futuro

Generación de vídeos por predicción
user

28/11/2016 - 21:17

Numerosos dispositivos pueden conservar momentos en la cámara, pero ¿qué pasaría si se pudieran capturar situaciones que estaban a punto de suceder?

Investigadores de MIT CSAIL han elaborado un algoritmo de aprendizaje profundo que puede crear vídeos mostrando lo que espera que suceda en el futuro.

Después de un entrenamiento extenso (2 millones de vídeos), el sistema de IA genera imágenes al combinar dos redes neuronales entre sí.

Una crea la escena determinando qué objetos se están moviendo en marcos inmóviles. La otra, mientras tanto, sirve como un control de calidad, es decir, determina si los vídeos son reales o simulados.

Se considera que el vídeo artificial es un éxito cuando el inspector IA es engañado al pensar que el metraje es genuino.

La tecnología definitivamente tiene sus límites. De momento, no puede producir vídeos más allá de los 1,5 segundos en el futuro, y los resultados no son realmente realistas: no es consciente de que los objetos todavía están allí cuando se mueven, y tiende a exagerar sus tamaños.

Red neuronal aprende a identificar criminales por sus rasgos faciales.

Sin embargo, es lo suficientemente bueno para predecir escenas relativamente complicadas como olas en la playa o personas caminando sobre césped.

Si CSAIL puede extender las predicciones y hacerlas más realistas, la tecnología podría tener un impacto de largo alcance.

Por ejemplo, los coches de auto-conducción podrían predecir dónde irán los vehículos y peatones, mientras que las cámaras de seguridad podrían detectar perturbaciones en imágenes basadas en lo que esperan ver.

También podría utilizarse para tareas relativamente cotidianas, como añadir animación a imágenes fijas o comprimir vídeos (ya que no necesitaría cada fotograma).

Y sin importar las circunstancias, predecir el futuro puede ayudar a la IA a entender lo que está pasando ahora mismo, lo que podría ayudar con casi cualquier instancia donde la visión por computadora es importante.

Ver ahora:

Te recomendamos