La Inteligencia Artificial jugando al póquer contra los seres humanos

poquer

En 2015 pudimos presenciar cómo varios de los mejores jugadores de póquer del mundo se enfrentaban a una inteligencia artificial llamada Claudico, un evento que duró 80.000 manos, y mañana será la revancha para determinar si, efectivamente, la Inteligencia Artificial también puede ganarnos al póquer.

Los resultados del anterior evento no ayudaron a estalecer conclusiones, por lo que este año tendremos cuatro profesionales de póquer humanos jugando por un premio de 200.000 contra una IA llamada Libratus, evento que se realizará en el Rivers Casino de Pittsburgh.

Todas las previsiones apuntan a que los humanos serán los ganadores, aunque se espera que en menos de cinco años la ventaja vaya para la máquina.

Los algoritmos típicos usados en este tipo de juegos calculan diferentes resultados del juego en tiempo real, y aplican un enfoque de “minimización de arrepentimiento” para ver qué estrategia conduce al mejor resultado. Por último calculan cuál es la estrategia más eficaz antes de realizar el movimiento.

En el caso de Libratus no es así, se podan ciertos caminos a través del tiempo y se crea un árbol de juego más pequeño, lo que reduce la carga computacional y acelera el tiempo de cálculo. Libratus también ha mejorado a su predecesor al adoptar un enfoque más seguro para la estrategia de fin de juego. A diferencia de Claudico, Libratus puede calcular cuánto ya se ha beneficiado de los errores del pasado de los oponentes en la mano actual, es decir, aprende mejor.

Libratus ha desarrollado su estrategia de juego de póquer ejecutando 15 millones de horas de procesador en un nuevo superordenador llamado Bridge antes de la próxima competición. En comparación, los algoritmos de Claudico sólo funcionaron entre 2 y 3 millones de horas en un superordenador más antiguo (y ahora retirado) llamado Blacklight, por lo que el competidor artificial ahora es mucho más avanzado que en 2015.

En ieee.org podemos leer más detalles, y mañana sabremos el resultado final.

Actualización: Ganó la máquina a todos los humanos que participaron en el torneo, dejando claro que el algoritmo utilizado era muy superior al anterior.

Juan Diego Polo

Estudió Ingeniería de Telecomunicaciones en la UPC (Barcelona), trabajando como ingeniero, profesor y analista desde 1998 hasta 2005, cuando decidió emprender creando wwwhatsnew.com.