Comment AlphaGo a transformé l’intelligence artificielle et le jeu de go
Comment AlphaGo a transformé l’intelligence artificielle et le jeu de go
Par Morgane Tual
Le programme de Google DeepMind s’apprête, à partir de mardi 23 mai, à affronter de nouveaux défis lors d’un grand tournoi en Chine. Depuis sa victoire contre l’icône Lee Sedol, AlphaGo a changé le jeu de go, mais aussi l’intelligence artificielle.
15 mars 2016. Le programme d’intelligence artificielle (IA) AlphaGo remporte l’ultime manche de son tournoi face au Sud-Coréen Lee Sedol, un joueur de go légendaire. Le moment est historique. La machine vient de battre l’humain 4-1 au jeu de go, un événement comparable à la victoire de Deep Blue contre Garry Kasparov aux échecs en 1997. Et ce, avec dix ou vingt ans d’avance sur les prévisions des experts. L’exploit est signé DeepMind, une entreprise londonienne rachetée en 2014 par Google.
Une grosse année plus tard, AlphaGo repart au combat. A l’occasion du sommet Future of go, qui se tient en Chine de mardi 23 à samedi 27 mai, le programme s’essaiera au « pair go », où il devra jouer en collaboration avec un humain, contre un autre duo homme-AlphaGo. Mais surtout, il devra affronter en trois manches le Chinois Ke Jie, le numéro un mondial actuel – Lee Sedol l’a longtemps été, et reste souvent considéré comme le meilleur joueur au monde. « Même si AlphaGo peut battre Lee Sedol, il ne peut pas me battre », avait fanfaronné Ke Jie, aujourd’hui âgé de 19 ans, peu après la victoire de l’intelligence artificielle.
Mais en un an, AlphaGo a changé, s’est amélioré, sans qu’on ne sache exactement dans quelle mesure – DeepMind se montre relativement discrète sur les avancées de son poulain. On sait toutefois qu’AlphaGo a, incognito, joué plusieurs parties en ligne contre quelques-uns des joueurs les plus réputés au monde, parmi lesquels Ke Jie. AlphaGo, dissimulé sous les noms de Magister et Master, a remporté haut la main cinquante des cinquante et une parties jouées – la 51e fut perdue à cause d’un problème de connexion Internet. Une telle prouesse a fini par générer quelques soupçons au sein de la communauté. Le 4 janvier, Demis Hassabis, le fondateur de DeepMind, leur a donné raison en révélant publiquement qu’AlphaGo se dissimulait derrière Magister et Master.
« On peut toujours essayer de faire mieux »
De quoi décourager les créateurs des autres programmes de go ? « Non, au contraire !, assure Tristan Cazenave, professeur d’intelligence artificielle au Lamsade de l’université Paris-Dauphine et spécialiste des programmes de go. Ça donne envie de faire aussi bien, voire mieux. » Après la victoire de Deep Blue, souligne-t-il, « beaucoup de chercheurs avaient arrêté de travailler sur les échecs. Mais aujourd’hui, certains programmes sont bien meilleurs ! On peut toujours essayer de faire mieux. » Lui n’a pas les moyens de Google DeepMind, mais s’attache malgré tout à tenter de reproduire une technologie similaire, même s’il s’agit d’un travail, le reconnaît-il, « un peu ingrat ».
Car la victoire d’AlphaGo a changé la donne dans le milieu des chercheurs en IA, et notamment ceux qui se consacrent aux jeux. « Ça nous a montré que l’approche du “deep learning” [la méthode d’apprentissage automatique utilisée par AlphaGo] était très efficace. Pas mal de gens se sont mis à faire des choses similaires pour d’autres jeux. »
Parmi eux, les développeurs des deux principaux concurrents d’AlphaGo, le japonais Deep Zen Go et le chinois Fine Art. « Deep Zen Go s’appelait avant “Zen”. Il a changé sa façon d’apprendre en introduisant le deep learning, et il a énormément progressé en un temps très court », explique Motoki Noguchi, ancien champion de France de go. Plus généralement, la victoire d’AlphaGo « a boosté les recherches en IA sur le go, avec une forte concurrence entre la Corée, le Japon et la Chine ».
D’autant plus, souligne-t-il, que ces pays ne s’attendaient pas à ce que des Anglais, peu réputés pour leur passion du go, les battent sur ce terrain. « Les entreprises japonaises et chinoises se sont dites : “il faut faire quelque chose !” » Pour le moment, Fine Art, développé par l’entreprise Tencent, se montre le plus fort, au point de « talonner AlphaGo », estime Motoki Noguchi. Mais le programme star de DeepMind ne participe pas, contrairement à ses concurrents, aux tournois impliquant d’autres IA.
C’est pourquoi l’événement auquel il prend part cette semaine a autant d’importance. Comme de nombreux spécialistes, Tristan Cazenave compte garder un œil attentif aux performances d’AlphaGo en Chine : « Comme il ne sort pas beaucoup, c’est intriguant, c’est très intéressant pour nous. »
Les grands joueurs imitent AlphaGo
Une autre catégorie d’experts ne manquera pas une miette des nouvelles prouesses du fameux programme : celle des grands joueurs de go. La victoire du programme de DeepMind a bouleversé leurs repères et rebattu les cartes de ce jeu millénaire. Désormais, dans les tournois de haut niveau entre humains, les coups étranges joués par AlphaGo reviennent régulièrement. « La première réaction, c’est d’imiter ce qu’il fait, de copier ses séquences, observe Motoki Noguchi. Des pros jouent des séquences considérées comme mauvaises. »
Car AlphaGo, qui ne joue pas comme un être humain, a remporté des parties avec des coups jusqu’alors quasiment tabous. Nul ne comprend aujourd’hui comment ces séquences, en principe catastrophiques, lui ont permis la victoire ; mais on les rejoue, inlassablement, dans l’espoir d’y trouver un jour une explication. « Si on arrive à résoudre ces énigmes, les joueurs de go pourront peut-être s’approcher de la vérité absolue du jeu de go », affirme Motoki Noguchi.
AlphaGo désarçonne, comme dans sa manière de changer de style de jeu, contrairement aux grands joueurs :
« On a chacun une préférence, pour le centre ou les bords… AlphaGo n’a pas cette préférence, on a l’impression que c’est un logiciel tout-puissant, qui maîtrise tout. C’est fascinant à voir. Cela va sûrement influencer beaucoup les joueurs. Avoir une préférence, est-ce que c’est une bonne chose ? Pour l’instant, on est surtout dans la période de digestion, on essaie d’apprendre à partir des données. »
Et celles-ci sont rares. Seulement cinq parties contre Lee Sedol au départ, auxquelles s’est ajoutée la cinquantaine de parties en ligne incognito. Chacune est minutieusement examinée, décortiquée, mais elles ne sont pas encore assez nombreuses pour en tirer des conclusions définitives, ni de nouvelles méthodes aussi efficaces qu’incontestables.
Ruptures de stock
Si l’influence d’AlphaGo est réelle auprès des experts en IA et en go, elle l’est aussi auprès d’un tout autre public : le grand. Rares sont ceux qui se souviennent du nom d’AlphaGo, mais nombreux sont ceux qui, sur les festivals ou les salons, interpellent les animateurs de la fédération française de go en leur parlant de « l’intelligence artificielle de Google ». « Avant, le go était relativement confidentiel, se souvient Laurent Coquelet, secrétaire de la fédération. Maintenant on a plus de demandes, de personnes qui s’intéressent, qui posent des questions. La relation est plus facile, car les gens connaissent déjà. »
Mais surtout, l’histoire très médiatisée d’AlphaGo a attiré de nouveaux profils :
« Historiquement, le go intéresse des informaticiens, des mathématiciens… l’archétype, c’était l’étudiant en maths de 20 ans. Aujourd’hui, c’est tous les âges, tous les genres, tout le monde en a entendu parler grâce à cet événement historique. Le go est venu remplacer les échecs comme le jeu le plus difficile au monde. »
Résultat de cet intérêt soudain pour le go : des ruptures de stock en série. Mais aussi des questions qui, jusqu’ici, ne se posaient pas trop pour la fédération. « Avant, la triche ne pouvait pas trop exister. Maintenant, avec les smartphones et ces programmes, des gens peuvent être tentés. On est obligés de réfléchir à rendre notre règlement plus strict. »
L’existence de ce nouveau super-adversaire, quasiment imbattable, ne décourage en tout cas ni les novices ni les confirmés. « C’est un jeu tellement complexe qu’on sait qu’on ne pourra jamais le maîtriser, même les plus grands joueurs le savent, pose, sereinement, Laurent Coquelet. Les ordinateurs augmentent notre recherche de progression. Le plaisir de jouer reste, et il est multiplié par le fait que la machine puisse nous aider. Les joueurs sont très motivés par cette IA qui les titille. »
Et AlphaGo occupe, depuis un an, les conversations et les pensées. « Dès qu’une partie est jouée, on ne dit plus “qu’est-ce que tel grand maître penserait de la situation” mais “qu’est-ce qu’AlphaGo en penserait”. L’IA devient une référence, alors qu’avant, elle était plus que négligée car elle n’arrivait pas à la cheville des meilleurs. » Pour lui, il n’y a aucun doute : avec AlphaGo, « c’est une nouvelle ère du jeu qui s’ouvre ».
(Illustration Fatih Cicek)