Terminator aprende a jugar a la consola

Así es, tal cual suena. Está aprendiendo a jugar a los clásicos de arcade de toda la vida, no sólo eso sino que además gana casi siempre a expertos gamers humanos. Pero no te asustes, no es que Schwarzenegger (Chuache para los amigos) haya apartado las pesas y se haya comprado una Atari. Uso Terminator como referente de inteligencia artificial, para ayudarte a imaginar la situación, porque en realidad de lo que te voy a hablar hoy es de un algoritmo matemático.

Lo mismo no te sorprende tanto que un ordenador gane a un humano en un juego. Y no me refiero cuando pierdes contra la consola al Fifa (si eso ocurre, es que tienes que ser un paquete de cuidado…). A los que son un poco más entraditos en años les sonará la mítica Deep Blue, aquella máquina que retó al gran maestro Kasparov al ajedrez, al que consiguió vencer en 1997. ¿Qué ha cambiado ahora? ¿Por qué esto es noticia en 2015? A ver si resulta que los marcianitos son más complicados ahora que el ajedrez… Pues la diferencia, amigo, amiga, es que Deep Blue contaba con millones de jugadas previamente programadas y almacenadas en su memoria, mientras que el algoritmo Chuache es capaz de aprender a jugar solo.

Has oído bien. Chuache aprende. Nadie lo ha enseñado a jugar. Los creadores de este algoritmo, científicos de Google, han publicado sus hallazgos en la prestigiosa revista Nature esta misma semana. Y no es para menos. Se trata de la primera vez en la historia que un software de inteligencia artificial consigue realmente aprender, y para ello usa un método basado en el aprendizaje animal: el refuerzo positivo.

Este tipo de aprendizaje se basa en la asociación de una serie de conductas o acciones con una recompensa. Un ejemplo, para que lo entiendas: en el caso de humanos, una experiencia satisfactoria hace que el cerebro genere dopamina, un neurotransmisor relacionado con el placer o sensación de bienestar. Así, el cerebro es capaz de interpretar ciertos estímulos externos, relacionarlos con experiencias pasadas y recordar cómo se actuó correctamente en una determinada situación, permitiendo que aquel recuerdo influya en decisiones futuras ante nuevas situaciones. No sé muy bien si te lo he aclarado, o ahora mismo estás pensando donde conseguir algo de dopamina de esa para entender mejor lo que te estoy contando…

Bueno, volviendo al tema de Chuache, el software de inteligencia artificial, en realidad se llama DQN (Deep Q-network, pero a mí me gusta más Chuache, y como el artículo es mío…), y lo han probado en alrededor de unos 50 juegos de arcade. El algoritmo no incluye ningún tipo de jugada almacenada previamente ni ningún otro tipo de información acerca del juego. Es exactamente el mismo algoritmo para cada juego diferente que se prueba. Al empezar la partida sólo tiene dos tipos de información: la puntuación inicial y el mapa de píxeles de la primera pantalla. Ponte en situación: es exactamente como tú, sentado frente a un monitor, frente a un juego nuevo del que nunca has oído hablar y del que desconoces los controles. El algoritmo se vuelve más y más complejo conforme aprende.

Chuache necesitó sólo dos semanas frente a un juego para batir a jugadores profesionales. No sólo eso, sino que además desarrollaba estrategias de juego que a los investigadores ni siquiera se les hubieran pasado por la cabeza.

A mí, sinceramente, esto me parece simplemente a-co-jo-nan-te. Eso sí, muy bueno será algoritmo, pero a ver si tiene cojones de ganarle a Celia Villalobos al Candy Crush. Ahí ya… Malo…

bluebird Comunicación
bluebird Comunicación
bluebird Comunicación
bluebird Comunicación
Artículo anterior2015
Artículo siguienteEl machismo que no cesa
Foto del avatar
Todo empezó con 'El mundo de Beakman'. Un tipo loco con bata blanca que tenía explicación para todo. Yo quería ser Beakman. Y en ello estoy.

Dejar respuesta

Please enter your comment!
Please enter your name here

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.