Un bot ha visto 70 000 horas de Minecraft para aprender a jugar casi perfectamente

Publicado el

robot jugando a minecraft

Ordenadores e inteligencias artificiales que aprender a jugar a videojuegos, ese es el futuro que nos espera, junto a personajes no jugadores que son cada vez más reales en nuestras partidas.

Ahora tenemos con nosotros al mejor bot jugador de Minecraft de la historia, una creación de OpenAI ha visto 70 000 horas de video de personas para poder aprender los más ocultos secretos de tan popular juego.

El objetivo no es solo crear a un buen jugador, es probar una técnica nueva y poderosa que podría usarse para entrenar máquinas para llevar a cabo una amplia gama de tareas.

En este caso, Minecraft AI aprendió a realizar secuencias complicadas de clics de teclado y mouse para completar tareas en el juego, como talar árboles y fabricar herramientas, todo con la técnica conocida como aprendizaje por imitación, en la que las redes neuronales se entrenan para realizar tareas al observar a los humanos hacerlas. El aprendizaje por imitación se puede utilizar para entrenar a la IA para controlar brazos robóticos, conducir automóviles o navegar por páginas web (lo que puede ser muy peligroso, por cierto).

En este caso han usado un enfoque diferente a lo que existe en la actualidad, donde las demostraciones en vídeo deben etiquetarse en cada paso. Con el nuevo sistema, llamado Video Pre-Training (VPT), se consigue etiquetar los videos automáticamente, ya que se registran las acciones y las consecuencias de forma automática.

Han elegido Minecraft porque es un juego sin un objetivo claro, podemos hacer lo que queramos, no hay ganador ni perdedor, siendo un buen entorno para entrenar la IA.

La IA, hasta ahora, ya había conseguido crear tablones y convertirlos en una mesa, lo que implica alrededor de 970 acciones consecutivas. Con este nuevo método consiguen realizar tareas que involucran más de 20 000 acciones consecutivas.

Aún estamos lejos de poder afirmar que esta IA es mejor que un humano jugando, pero ese límite cada vez está más cerca.

Podéis leer más detalles en el MIT.

Comparte en: