La 3ª victoria de AlphaGo y de todos

Lee Sedol perdió. O mejor dicho, AlphaGo ganó, pues el humano jugó una excelente partida. No hubo un claro movimiento perdedor, sino minúsculas imperfecciones. En todo caso, está claro que todos ganamos. AlphaGo abre nuevos caminos en la inmensidad del juego del Go, al innovar con jugadas nunca vistas.

deep mindEl que parece conocer más a AlphaGo, Lee Sedol, habla así de la máquina: «AlphaGo es una programa absolutamente sorprendente, pero creo que no es del nivel y perfección de un dios. Juega diferente a los humanos, con unas formas superiores, pero claramente tiene puntos débiles.»

Lee Sedol: «Quiero decir que la partida de hoy es una derrota de Lee Sedol pero no es una derrota de la humanidad. Todavía quedan las partidas 4 y 5. Por favor, estad conmigo hasta el final.»

Es curioso ver como, si en la 1ª partida los profesionales se reían del ingenio electrónico, y en la 2ª partida lo llamaban «Al-sabomnim»(maestro), en la 3ª lo llaman «PhaGo», lo que sería el nombre propio sin apellido (en coreano). Es decir, que los profesionales quieren ser colegas de PhaGo, ir de fiesta con él, echar unas partidas para pasar el rato. La máquina no es que supere el test de Turing, sino además «el test de la cerveza» (el de ser «cool»).


COMPARACION CON DEEPBLUE

Cuando Deepblue ganó a Kasparov, se discutió mucho sobre los ajustes que se hacían durante las partidas. Esto con AlphaGo, al ser red neuronal, no es posible. También se criticó que tras las partidas se «desmontara» el software y el hardware, y aun pasaran varios años hasta poder tener algo similar en manos de los aficionados.

Con AlphaGo parece que no pasará así, y quizás en unos meses podamos jugar con sus redes neuronales, de la misma forma que ya podemos jugar a crear imágenes oníricas. Además, el CEO de Deepmind comentaba hoy que la versión distribuida gana a la versión de una sola máquina solo el 75% de las veces. Esto es, sin necesidad de un cloud de miles de procesadores, el programa puede jugar a nivel profesional.


¿POR QUE EN ENERO SE HIZO PUBLICO?

Esto me intriga. AlphaGo jugó con Fan Hui (el campeón europeo) en octubre, pero no se anunció publicamente hasta enero, e inmediatamente se lanzó el reto a Lee Sedol. ¿Por qué?

Oficialmente con Fan Hui 2p(= 2 dan pro) se jugaron 5 partidas, donde perdió, pero se ha ocultado bastante que también se jugaron otras 5 partidas, a menos tiempo, donde Fan Hui ganó 2. Así que, en aquel momento, se podría suponer que AlphaGo era un poco más de 2p.

En Go, a diferencia del ajedrez, es fácil establecer diferencias entre jugadores. El hándicap se basa en dar piedras de ventaja. Así, un jugador de nivel 2p podría estar a 1 o 2 piedras de hándicap de Lee Sedol.

Es sencillo evaluar el avance del nivel de AlphaGo. Si el AlphaGo de octubre juega con al AlphaGo de enero, y necesita 2 piedras para ganar el 50% de las veces, ya está preparado para jugar con Lee Sedol. Tiempo de lanzar el reto. Esta es mi hipótesis.


NUEVOS TIEMPOS
Lo que también parece claro es que la máquina mejoró entre enero y marzo, quizás ganando 1 o 2 piedras más. Y cuando se ha enfrentado a Lee Sedol ya tenía un nivel muy superior. Aunque parece que aun un nivel de un dios, que Otake Hideo 9p estimó en 3 piedras por encima suya.

En la inmensidad de los caminos del Go, los humanos encontraron uno y a través de los siglos han ido mejorándolo. Desde las Anacletas de Confucio (Siglo V a.C.), donde se menciona el Go por primera vez, pasando por el Xuanxuan Qijing (libro de 1349), que contiene problemas que aun estudian los aspirantes a profesional, hasta llegar a AlphaGo. Y de pronto la máquina demuestra que hay otros caminos igualmente válidos, que muchas hipótesis que teníamos no sirven en luchas locales, pero si sirven para un resultado global.

Go SeigenA diferencia de DeepBlue, que ni aportó nuevas aperturas al ajedrez, AlphaGo ha lanzado al escenario una nueva riqueza de conceptos increíble. Todo jugador, ya sea aficionado o profesional, mira con nuevos ojos el juego. Y los que aprendan ahora a jugar, tendrán aun más caminos por optar. En definitiva, vivir estos tiempos es un regalo.

AlphaGo usó una base de datos de partidas en KGS (un servidor donde juegan aficionados occidentales) como semilla para empezar a entrenar la máquina. Me imagino otro AlphaGo que empiece a aprender a partir de otra fuente. Por ejemplo, en base a las partidas de Go Seigen, el mejor jugador del S.XX y quizás de todos los tiempos. ¿Tendría su personalidad? ¿Se lograría así la inmortalidad de su juego?

Por otro lado, saber que Fan Hui ganó alguna partida, pero solo en partidas rápidas, redefine o más bien reafirma el concepto de la intuición, tan usado para hablar del Go. ¿Cuanto menos tiempo tenga la máquina, más opciones tendremos de ganar (en cualquier juego o situación)?


LA PARTIDA

Lee Sedol (negro) jugó en su estilo. Preparó una zona de influencia, la máquina tuvo que invadir y Lee atacó. Por fin vimos a AlphaGo (blanco) manejando un grupo débil propio. Pero pudo escapar y el contraataque fue fuerte. Hay quien dice que la jugada perdedora fue la 31, dejando escapar al grupo débil. Pero a ese punto, casi al principio de una partida, es difícil de confirmar.

Cuando estaba claro que Lee perdía, el humano jugó a un meta-juego, probando varias jugadas para ver como la máquina respondía. Buscando debilidades para aprovechar en futuras partidas.

El caso más claro fue buscar un ko, un caso especial de movimiento que suele generar caos en la partida, pues la posición local pasa a depender de todo el tablero. AlphaGo había evitado kos en la 1ª y 2ª partida, huyendo del caos. Pero, como dijo el comentarista tras esta 3ª partida: «AlphaGo odia los kos, y ese parece ser su punto débil. Aunque al verse forzado a jugarlo, la secuencia de amenazas de ko que ha hecho ha sido perfecta.»

La 1ª partida fue como una fiesta. La 2ª fue la lucha real. La 3ª fue el reto. Ahora queda la 4ª y 5ª: las del honor. Si Lee Sedol gana una partida, será su obra maestra. ¡Esperemos que así sea!

(;FF[4]GM[1]SZ[19]ST[2]CA[UTF-8]RO[3]PB[Lee Sedol]BR[9p]PW[AlphaGo]KM[7.5]DT[2016-03-12]RE[W+R]RU[Chinese];B[pd];W[pp];B[cd];W[dp];B[cn];W[fq];B[id];W[qf];B[nc];W[qm];B[dj];W[ed];B[dc];W[eg];B[ef];W[de];B[df];W[ce];B[ec];W[fd];B[ff];W[fc];B[bd];W[he];B[ie];W[hd];B[ic];W[hg];B[if];W[gg];B[jh];W[ci];B[dg];W[di];B[ei];W[bg];B[bh];W[be];B[bi];W[cj];B[dh];W[dk];B[ej];W[ck];B[ch];W[gi];B[fh];W[dm];B[dn];W[fg];B[eh];W[fm];B[ek];W[el];B[gk];W[ii];B[cm];W[fo];B[en];W[fl];B[bk];W[bj];B[aj];W[hm];B[hj];W[hi];B[gj];W[ji];B[il];W[jn];B[cp];W[cq];B[dq];W[dr];B[bq];W[eq];B[pm];W[pl];B[qn];W[om];B[pn];W[ql];B[ol];W[on];B[rn];W[oo];B[ok];W[qi];B[ll];W[hc];B[qq];W[qp];B[rp];W[pq];B[rq];W[qr];B[rr];W[ln];B[qe];W[re];B[rd];W[pe];B[qd];W[bb];B[dd];W[ee];B[cb];W[bc];B[ad];W[eb];B[ba];W[gb];B[qk];W[pk];B[lo];W[mn];B[pj];W[qj];B[rl];W[rk];B[rm];W[qk];B[cr];W[pf];B[iq];W[kq];B[lq];W[jq];B[jo];W[kn];B[hr];W[ip];B[hp];W[io];B[jr];W[kr];B[ho];W[gq];B[hq];W[in];B[fn];W[gn];B[go];W[gr];B[gs];W[fs];B[is];W[ib];B[ks];W[lr];B[dq];W[hn];B[ds];W[cq];B[fp];W[eo];B[do];W[ep];B[er];W[hs];B[qh];W[ph];B[gs];W[dq];B[br];W[hs];B[pi];W[oh];B[gs];W[bp];B[hs];W[co];B[bo];W[bn];B[cp];W[cs])
Esta entrada fue publicada en En Corea, Estrategia, Historia del juego, Jugadores profesionales, Torneos de profesionales. Permalink.

3 respuestas a La 3ª victoria de AlphaGo y de todos

  1. Javier dijo:

    Cuando comentas:
    Aunque parece que aun un nivel de un dios, que Otake Hideo 9p estimó en 3 piedras por encima suya.

    Entiendo que quieres decir que AlphaGo aún no ha alcanzado un nivel de Dios. Haciendo las jugadas perfectas.

    Aprovecho el comentario para agradecerte el seguimiento de las partidas, desde tu punto de vista de jugador de go, informático y persona que ha residido en Corea.

    • julio dijo:

      Exacto. Hasta el propio Lee Sedol dice que AlphaGo no juega como un dios. Pero, si Otake Hideo 9p dijo que dios está 3 piedras por encima de un 9p, quizás AlphaGo puede estar a 2 piedras… Me encantaría verlo dando hándicap a profesionales.

  2. francisco dijo:

    Entre nada o casi nada para informarse del Go en Español queda compensado con este blog, si ya era bueno de antes las 3 últimas entradas son de nivel 9 dan pro, ¡un 10! porque la comunidad hispanohablante ha podido informarse de este gran acontecimiento con 3 grandes entradas.
    En la primera derrota de Lee estaba desorientado, la segunda empezaba a verlo como una tragedia sin saber interpretar si era positivo o negativo, ahora y gracias a la explicación en este post muchos estamos ilusionados de lo que depara el futuro. Parece que con esta derrota… todos ganamos.
    Gracias,