Logo Computerhoy.com

El mejor jugador de la historia de Minecraft es un bot creado con Inteligencia Artificial

Biblioteca sin Censura en Minecraft

Uno de los juegos con mayor potencial es Minecraft, no en balde se dejó Microsoft varios cientos de millones de euros en su compra. Ahora, una IA creada a través de OpenAI se ha convertido en el jugador definitivo de este juego.

OpenAI ha creado el mejor robot para jugar a Minecraft hasta la fecha. Para convertirlo en el jugador total le hicieron ver unas 70.000 horas de vídeos de personas jugando al popular videojuego de Microsoft (algo sencillo, ya que es un título jugado por miles de creadores de contenido).

Esta forma de aprendizaje está sacada de los propios humanos y podría utilizarse para entrenar a robots (mediante inteligencia artificial), consiguiendo así que lleven a cabo una amplia gama de tareas. YouTube es una fuente gigantesca de información muy aprovecha por esta técnica.

La IA de Minecraft aprendió a realizar complicadas secuencias de clics de teclado y ratón para completar tareas en el juego, como talar árboles y fabricar herramientas.

Es el primer robot que puede fabricar las llamadas herramientas de diamante, una tarea que suele llevar a los buenos jugadores humanos 20 minutos de clics a gran velocidad: 24.000 acciones de precisión.

El resultado, como decíamos, es un gran avance en una técnica conocida como aprendizaje por imitación, en la que las redes neuronales se entrenan para realizar tareas viendo a los humanos hacerlas.

YouTube como herramienta de aprendizaje definitiva

El aprendizaje por imitación puede utilizarse para entrenar a la IA a controlar brazos robóticos, conducir coches o navegar por páginas web. Pero el potencial va mucho más allá, como explican en el MIT Technology Review.

Hay una gran cantidad de vídeos en línea que muestran a personas realizando diferentes tareas. Aprovechando este recurso, los investigadores esperan hacer con el aprendizaje por imitación lo que la GPT-3 hizo con los grandes modelos lingüísticos.

Minecraft

El problema de los enfoques existentes para el aprendizaje por imitación es que las demostraciones de vídeo necesitan ser etiquetadas en cada paso: hacer esta acción hace que ocurra esto, hacer aquella acción hace que ocurra aquello, y así sucesivamente.

Anotar a mano de esta manera es mucho trabajo, por lo que estos conjuntos de datos tienden a ser pequeños. El equipo que desarrolló el bot con OpenAI quería encontrar una forma de convertir los millones de vídeos disponibles en Internet en un nuevo conjunto de datos.

Inteligencia Artificial

DepositPhotos

Una red neuronal dedicada a explicar qué hace cada cosa

El método del equipo, denominado preentrenamiento de vídeo (VPT), sortea el cuello de botella del aprendizaje por imitación entrenando otra red neuronal para etiquetar los vídeos automáticamente.

Los investigadores contrataron primero a trabajadores para que jugaran a Minecraft y grabaron sus pulsaciones de teclado y ratón junto con el vídeo de sus pantallas. Así obtuvieron 2.000 horas de juego anotado de Minecraft, que utilizaron para entrenar un modelo que relacionara las acciones con los resultados en pantalla.

El siguiente paso fue utilizar este modelo para generar etiquetas de acción para 70.000 horas de vídeo sin etiquetar tomadas de Internet y, a continuación, entrenar el bot de Minecraft con este conjunto de datos más amplio.

El aprendizaje por imitación es una alternativa al aprendizaje por refuerzo, en el que una red neuronal aprende a realizar una tarea desde cero mediante el método de ensayo y error. Es la técnica que está detrás de muchos de los mayores avances de la IA en los últimos años.

Recrean el universo conocido en Minecraft y su aspecto es formidable

Se ha utilizado para entrenar modelos que pueden vencer a los humanos en videojuegos, controlar un reactor de fusión y descubrir una forma más rápida de hacer matemáticas fundamentales.

El problema es que el aprendizaje por refuerzo funciona mejor en tareas que tienen un objetivo claro, en las que las acciones aleatorias pueden conducir a un éxito accidental. Los algoritmos de aprendizaje por refuerzo recompensan esos éxitos accidentales para que sea más probable que se repitan.

Minecraft, el banco de pruebas preferido por los expertos

Pero Minecraft es un juego sin un objetivo claro. Los jugadores son libres de hacer lo que quieran: deambular por un mundo generado por ordenador, extraer diferentes materiales y combinarlos para crear diferentes objetos. 

El carácter abierto de Minecraft lo convierte en un buen entorno para entrenar la IA. Por ese motivo no son los únicos. El Minecraft se está convirtiendo en un importante banco de pruebas para nuevas técnicas de IA.

Minecraft app para móviles
Mojang

Con el uso de VPT, el bot de OpenAI fue capaz de llevar a cabo tareas que habrían sido imposibles solo con el aprendizaje por refuerzo, como fabricar tablones y convertirlos en una mesa, lo que implica unas 970 acciones consecutivas.

Aun así, el equipo descubrió que los mejores resultados se obtuvieron utilizando conjuntamente el aprendizaje por imitación y el aprendizaje por refuerzo. El futuro de la inteligencia artificial pasa por conseguir unir estas dos técnicas en casi todos los campos existentes.

Descubre más sobre , autor/a de este artículo.

Conoce cómo trabajamos en Computerhoy.