OpenAI veut battre les humains à « Dota 2 ». / Dota 2

Objectif : Vancouver, août 2018. C’est là que s’affronteront les meilleurs joueurs au monde de Dota 2, l’un des jeux vidéo les plus populaires de la scène e-sport. Parmi eux se glissera une équipe atypique : OpenAI Five, composée de cinq programmes d’intelligence artificielle – un par personnage. Parviendra-t-elle à se distinguer, et à battre des équipes professionnelles lors de cette compétition prestigieuse ? « Nous ne savons pas si nous y arriverons, mais nous pensons qu’avec beaucoup de travail [et un peu de chance], ça peut marcher », expliquent les concepteurs de cette équipe sur leur site.

Lundi 25 juin, ils ont en effet annoncé être parvenus à battre, pour la première fois et lors d’une rencontre informelle, une équipe semi-pro de haut niveau. Une étape prometteuse, au cœur d’un défi complexe. Alors que les machines savent désormais battre les meilleurs humains aux échecs (depuis 1997) et au jeu de go (depuis 2016), les chercheurs en intelligence artificielle s’intéressent aux jeux vidéo, notamment les jeux de stratégie en temps réel Dota 2 et Starcraft 2.

Dota 2 oppose deux équipes de cinq joueurs, dont chacun incarne un personnage différent. Leur objectif : détruire la base du camp opposé et protéger la sienne de ses attaques. Chaque personnage dispose de caractéristiques propres, et les joueurs doivent se coordonner pour attaquer l’ennemi.

Un millier de possibilités

Ce jeu soulève des problèmes bien différents, pour une machine, que les échecs ou le go. Par exemple, un joueur de Dota 2 ne voit pas tout l’environnement du jeu, ni tout ce que fait son adversaire : il lui manque donc des données cruciales. Qui plus est, soulignent les chercheurs, un joueur d’échecs a le choix, à chaque coup, entre 35 possibilités ; un joueur de go 250. Il y en aurait « un millier de valides » pour Dota 2. Sans oublier que les parties sont longues (45 minutes) et que les décisions doivent se faire de façon quasi instantanée.

L’équipe OpenAI Five a été conçue par OpenAI, une organisation à but non lucratif cofondée en 2015 par Elon Musk, le médiatique patron du constructeur automobile Tesla. Présentée comme un rempart face aux dangers potentiels de l’intelligence artificielle, elle finance différentes recherches sur l’IA et publie les articles scientifiques qui en découlent.

Pour rendre son équipe efficace, elle l’a fait jouer contre elle-même pendant des millions de parties. C’est ce qui s’appelle l’apprentissage par renforcement : l’algorithme apprend par expérience, en fonction de ses essais, de ses erreurs et de ses réussites. OpenAI explique avoir lancé des parties en série, et en simultané, sur des dizaines de milliers de processeurs. Chaque jour, le système a ainsi joué l’équivalent de 180 années à Dota 2.

En août dernier déjà, OpenAI s’était fait remarquer pour ses performances sur Dota 2, en écrasant un joueur star nommé Dendi. Mais la partie était effectuée en un contre un. Cette fois, c’est bien une équipe entière, composée de cinq programmes, qui en affrontera une autre, bien humaine, à Vancouver.