Pourquoi les experts des échecs ont-ils été surpris par la victoire d'AlphaZero contre Stockfish?
10
Il a été récemment porté à mon attention que les experts des échecs ont pris le résultat de ce match désormais célèbre comme quelque chose de bouleversé.
En tant que non-expert des échecs et de l'IA d'échecs, je supposais que, sur la base des performances d'AlphaGo et de la validation de ce type de méthode par rapport aux jeux combinatoires, l'IA plus ancienne n'aurait aucune chance.
Pourquoi la victoire d'AlphaZero était-elle surprenante?
D'abord et avant tout, à Go, Deepmind n'avait pas d'adversaires surhumains à défier. Les moteurs Go n'étaient pas du tout au plus haut niveau des meilleurs joueurs humains. Aux échecs, cependant, les moteurs sont 500 points ELO plus forts que les meilleurs joueurs humains. C'est une énorme différence. La quantité de travail consacrée aux moteurs d'échecs contemporains est stupéfiante. Nous parlons de millions d'heures de programmation, de centaines de milliers d'itérations. Il s'agit d'un énorme corpus de connaissances et de travail. Surmonter et dépasser tout cela en 4 heures est stupéfiant.
Deuxièmement, ce n'est pas tant le résultat lui-même qui surprend les maîtres d'échecs, mais plutôt la façon dont AlphaZero joue aux échecs. Il est assez ironique qu'un système qui n'avait aucune connaissance ou expertise humaine joue le plus comme nous. Les moteurs sont réputés pour jouer des mouvements laids, ceux qui manquent d'harmonie, etc. AlphaZero ne joue pas du tout comme ça. Il a un style très humain où il domine les pièces de l'adversaire avec un jeu stratégique profond et des sacrifices de position étonnants. AlphaZero joue la façon dont nous aspirons, combinant une compréhension profonde de la position avec la précision d'un calcul de moteur.
Edit
Oh et j'ai oublié de mentionner quelque chose sur le résultat lui-même. Si vous n'êtes pas familier avec les échecs informatiques, cela peut ne pas sembler stupéfiant, mais c'est le cas.
De nos jours, les marges de la victoire qui séparent les meilleurs moteurs contemporains sont minces. Dans un match de 100 matchs, vous pouvez vous attendre à voir un résultat comme 85 matchs nuls, 9 victoires et 6 défaites pour déterminer le meilleur moteur.
AlphaZero 28 victoires et 72 matchs nuls avec aucune perte était un écrasement d'un autre monde et était complètement impensable jusqu'au moment où il s'est produit.
Bonne réponse. Votre point sur la comparaison entre les échecs d'IA est intéressant en termes de limitation basée sur la boucle de Chess et la triade Win / Loss / Draw. (Peut-être, à l'avenir, nous aurons besoin de jeux finis et intraitables qui permettront une analyse plus granulaire en termes de résultats.) Je connais l'histoire des moteurs d'échecs, et la quantité énorme d'efforts et de connaissances humaines qui y ont été consacrés, mais le contexte du manque de succès re: le Go 19x19 beaucoup plus complexe avait une ramification opposée à moi.
DukeZhou
Plus précisément, mon hypothèse était que si AlphaGo pouvait battre les meilleurs humains dans le jeu beaucoup plus complexe, il semblait raisonnable de battre non seulement les meilleurs humains, mais les meilleures IA précédentes dans n'importe quel autre jeu.
DukeZhou
Le peu de mouvements artificiels est assez important, et ce n'est pas quelque chose dont j'ai vu des joueurs non-échiquiers parler. +1
Stella Biderman
4
Les SCTM pour les échecs avaient été essayés dans la littérature avec peu de succès. On supposait que l'approche d'AlphaGo ne fonctionnerait jamais sur les échecs, peut-être dans Go mais pas dans les échecs. Soudain, Google a annoncé que l'approche fonctionnait et battait le programme d'échecs le plus puissant du monde par une marge très significative.
Avant Google, tous les programmeurs d'échecs apprenaient que la fabrication d'heuristiques dans la programmation de moteurs était une meilleure stratégie que l'apprentissage automatique. Peu importe la façon dont vous avez implémenté les réseaux de neurones, cela n'aurait jamais fonctionné plus vite qu'un tas d'instructions de bitboards 64 bits. AlphaGo fonctionnait assez lentement , mais il jouait aux échecs les plus forts.
Je vois, sur la base des articles que vous fournissez, de nombreux niveaux de surprise dans la victoire:
Les échecs sont difficiles à maîtriser et la contrepartie avait les meilleures pratiques du monde, AlphaZero avait tabula rasa.
L'apprentissage a pris quatre heures et AlphaZero n'a perdu aucun match de 100.
Le style de jeu était un mélange étranger de mouvements humains et informatiques, agressifs et parfois loufoques avec des sacrifices qui n'ont aucune idée mais qui renforcent en fait le statut futur.
Le nombre de possibilités prises en compte par coup était inférieur à la contrepartie, AlphaZero avait un sentiment ou une intuition mystérieuse.
Le sentiment bouleversé provenait de la quantité de matériel d'entraînement qu'AlphaZero avait construit et de la limite de temps, ce qui ne donnait peut-être pas assez de temps à la machine traditionnelle.
Les SCTM pour les échecs avaient été essayés dans la littérature avec peu de succès. On supposait que l'approche d'AlphaGo ne fonctionnerait jamais sur les échecs, peut-être dans Go mais pas dans les échecs. Soudain, Google a annoncé que l'approche fonctionnait et battait le programme d'échecs le plus puissant du monde par une marge très significative.
Avant Google, tous les programmeurs d'échecs apprenaient que la fabrication d'heuristiques dans la programmation de moteurs était une meilleure stratégie que l'apprentissage automatique. Peu importe la façon dont vous avez implémenté les réseaux de neurones, cela n'aurait jamais fonctionné plus vite qu'un tas d'instructions de bitboards 64 bits. AlphaGo fonctionnait assez lentement , mais il jouait aux échecs les plus forts.
la source
Je vois, sur la base des articles que vous fournissez, de nombreux niveaux de surprise dans la victoire:
Les échecs sont difficiles à maîtriser et la contrepartie avait les meilleures pratiques du monde, AlphaZero avait tabula rasa.
L'apprentissage a pris quatre heures et AlphaZero n'a perdu aucun match de 100.
Le style de jeu était un mélange étranger de mouvements humains et informatiques, agressifs et parfois loufoques avec des sacrifices qui n'ont aucune idée mais qui renforcent en fait le statut futur.
Le nombre de possibilités prises en compte par coup était inférieur à la contrepartie, AlphaZero avait un sentiment ou une intuition mystérieuse.
Le sentiment bouleversé provenait de la quantité de matériel d'entraînement qu'AlphaZero avait construit et de la limite de temps, ce qui ne donnait peut-être pas assez de temps à la machine traditionnelle.
la source