Data / IA
L’IA collective OpenAI Five s’incline face aux pros du jeu
Par Laurent Delattre, publié le 30 août 2018
L’intelligence humaine l’a finalement emporté, non sans difficulté, face à l’intelligence artificielle collective d’OpenAI dans une partie acharnée sur DOTA 2. Au-delà des aspects techniques et ludiques, l’expérience aura démontré les capacités des réseaux de neurones à collaborer pour élaborer des stratégies et comprendre le fonctionnement d’un monde plein d’incertitude…
C’est la fin de notre saga de l’été. Depuis juin, nous suivons l’évolution du projet d’intelligence artificielle collective d’OpenAI, l’association à but non lucratif créée par Sam Altman et Elon Musk.
Cette IA est composée de cinq réseaux neuronaux récurrents à mémoire (LSTM – Long Short Term Memory networks) entraînés ensemble par des techniques de « Reinforcement Learning ». Ces dernières permettent à chaque réseau de neurones d’acquérir par des sessions d’essais (menant à des succès ou des échecs) un comportement stratégique ici utilisé pour jouer en équipe au célèbre jeu DOTA 2, un jeu multijoueur en ligne d’arènes de combat.
L’objectif d’OpenAI Five est de démontrer que des réseaux de neurones peuvent collaborer afin d’élaborer des stratégies gagnantes, une expérience originale et unique puisque jusqu’ici les réseaux de neurones opèrent essentiellement de façon autonome pour comprendre la parole, reconnaître des éléments d’image, traduire des textes ou encore détecter des patterns dans une masse d’informations. Un autre objectif poursuivi est de développer des modèles à même de percevoir et comprendre la complexité du monde réel et ses incertitudes.
Autrement dit, si le jeu sert ici de terrain d’exploration, l’expérimentation OpenAI Five trouvera à terme des applications professionnelles, voire industrielles, notamment en matière d’optimisation des trafics urbains, de sécurisation des bâtiments, d’automatisation au sein des usines et des entrepôts, etc.
Après ses premiers pas en juin, OpenAI Five s’est confrontée pour la première fois début juillet à une équipe d’amateurs, emportant ses premières victoires (cf « Pourquoi l’intelligence ludique d’OpenAI va servir l’IA d’entreprise »). Poursuivant son initiation, elle l’a de nouveau emporté, début août, face à une équipe d’anciens joueurs professionnels révélant une étonnante précision dans ses actions et une totale absence d’indécision dans ses stratégies (cf « L’IA collaborative d’OpenAI ridiculise des pros »).
Point d’orgue de l’opération, l’intelligence artificielle collective a participé les 22 et 23 août au grand tournoi « The International 2018 » pour affronter les meilleurs joueurs de DOTA 2…
Et elle a, cette fois, été vaincue mais non sans mérite, perdant ses 2 premiers matchs (une partie se jouant au meilleur des 3 matchs) face aux joueurs les plus expérimentés de la planète. La victoire humaine s’est construite dans la persévérance et la souffrance. La première partie a duré 45 minutes, la seconde 51 minutes. Des durées anormalement longues, témoignant de l’intensité des combats et de l’absence d’une réelle supériorité d’un côté comme de l’autre.
Contrairement aux parties précédentes où chaque joueur (humain comme IA) disposait de sa propre unité indestructible (dénommée Courrier) pour récolter les items parsemés sur le champ de combat, les parties jouées à l’International 2018 se conformaient aux règles normales des vraies parties DOTA 2 et n’autorisaient donc qu’un seul « courrier » par ailleurs vulnérable. L’IA n’avait eu que quelques jours pour se familiariser à cette nouvelle complexité (pour elle). En outre, les personnages joués par les deux camps avaient été désignés par un jury pour une équité optimale, l’IA n’avait donc pas pu choisir ses personnages.
Des contextes nouveaux qui expliquent en partie les échecs d’OpenAI Five. Cette défaite n’en demeure pas moins une victoire pour l’intelligence artificielle d’une manière générale. L’expérimentation s’est révélée instructive (rappelons que les chercheurs doutaient au départ des aptitudes des réseaux LSTM à construire une planification stratégique) et constitue une avancée importante par sa démonstration des capacités collaboratives de plusieurs IA. Elle n’est d’ailleurs pas terminée puisque les chercheurs d’OpenAI veulent poursuivre les apprentissages, corriger les bugs, et retirer du programme les deniers éléments de logique scriptée encore présents afin d’offrir à leur IA ludique une revanche…