Pourquoi un jeu d'échecs peut-il améliorer les chances de gagner, selon l'ordinateur?

14

Lorsque vous regardez la coupe Sinquefield sur http://grandchesstour.org/ , il est possible d'essayer différents mouvements et de voir comment l'ordinateur évalue la position après le mouvement suggéré.

Maintenant, la plupart des mouvements altéreront votre position, si ce n'est pas considéré comme le meilleur mouvement par l'ordinateur. Mais pour certains mouvements (assez souvent), vous obtenez instantanément une chance accrue de gagner, peut-être un demi-avantage de pions. Je ne comprends pas ceci: si un seul coup a le potentiel d'améliorer considérablement la position des joueurs, cela ne devrait-il pas déjà se refléter dans la position actuelle avant le coup? Dans mon esprit, tout mouvement qui n'est pas considéré comme le meilleur mouvement par l'ordinateur devrait conduire à une position altérée, tandis que le meilleur mouvement devrait tout au plus maintenir la position uniforme, sans réellement améliorer la position des joueurs. Parce que, si l'ordinateur sait que ce mouvement améliorera la position des joueurs, alors il devrait déjà à la position actuelle améliorer la position des joueurs, en disant que "avec le meilleur jeu, vous êtes un demi-pion"?

Hmm, ou peut-être est-ce simplement le résultat de la mise en œuvre du site Web sur grandchesstour.org?

jonasfh
la source
4
Dans certains cas, les moteurs ont du mal à trouver le bon mouvement mais l'évaluent correctement lorsque vous le saisissez manuellement. Ce n'est pas aussi courant que ce que vous décrivez.
11684

Réponses:

26

Si l'ordinateur était capable d'évaluer chaque ligne de jeu jusqu'à la fin de la partie, l'évaluation ne changerait jamais. En effet, l'évaluation de chaque coup serait soit "gagnant", "perdant" ou "nul". C'est essentiellement ce qui se passe dans les bases de table de fin de partie. * Si les ordinateurs pouvaient le faire pour chaque position, chaque match contre un ordinateur consisterait à ce que l'ordinateur démissionne sans faire de mouvement, vous offrant un match nul à la position initiale ou étant ennuyé que vous n'ayez pas démissionné ou accepté cette offre de tirage.

Cependant, les ordinateurs ne peuvent pas évaluer aussi loin car cela prendrait un temps incroyablement long, à la fois parce que les jeux peuvent être très longs (des centaines de coups, en principe) et parce qu'il y a beaucoup de possibilités à chaque coup. Les ordinateurs doivent donc prendre un certain nombre de raccourcis. Cela comprend essayer de comprendre rapidement quels sont les mouvements candidats les plus importants (prendre une pièce non protégée est probablement un grand mouvement; accrocher votre reine est probablement un mouvement horrible; ...) et également arrêter la recherche après plusieurs mouvements et utiliser des heuristiques au lieu de chercher plus pour essayer de déterminer si la position résultante semble bonne ou non.

Le problème est que ces raccourcis peuvent mal tourner. L'ordinateur peut décider que suspendre une pièce est mauvais alors qu'il s'agit en fait d'un sacrifice de génie. Il pourrait décider qu'une position s'est stabilisée alors qu'elle ne l'a pas vraiment été. Il pourrait simplement ne pas avoir suffisamment de puissance pour voir suffisamment loin dans l'avenir pour voir le véritable point d'un mouvement particulier.

Voici un exemple simple, bien qu'il ne soit plus très réaliste. Supposons que vous êtes sur le point de me mater, mais j'ai une série de dix chèques que je peux faire pour vous retarder. Si je regarde seulement dix coups à l'avance, je pense que je vais bien: peut-être que je suis même un pion, donc mon évaluation est "Après dix coups, je suis toujours un pion, donc je suis bon Score +1 "Je joue mon premier chèque, tu réponds, et maintenant je vois que c'est mate sur dix et démissionne. C'est ce que l'on appelle «l'effet d'horizon» que les programmes modernes tentent d'éviter (par exemple, en regardant plus profondément le long de lignes qui ont beaucoup de mouvements forcés), mais il illustre le principe général.

Si le moteur peut voir, disons, dix coups dans le futur, alors il voit plus loin dans le jeu à chaque mouvement. À la position initiale, il peut voir à quoi ressemblera la planche au coup 10; après un mouvement, il peut voir se déplacer 11 et ainsi de suite. (Encore une fois, c'est une simplification, car les ordinateurs ne regardent pas aujourd'hui à une distance fixe dans le futur, mais cela vous donne une idée générale.)

L'exemple que vous avez donné n'est qu'une version moins dramatique des exemples que j'ai donnés. Au fur et à mesure que plus de mouvements sont effectués, l'ordinateur peut voir plus profondément dans le jeu, il peut donc donner une évaluation plus précise. Une autre façon de voir cela est en termes d'informations: à mesure que plus de coups sont joués, l'ordinateur a plus d'informations. Auparavant, vous deviniez quelle serait votre réponse à 1.e4, mais maintenant, vous savez que vous avez joué au Sicilien, etc.


* Il y a une légère nuance ici en ce que vous devez réellement compter le nombre de coups vers la victoire pour éviter de répéter les positions. Par exemple, considérez la phase finale de KQ vs K. Chaque mouvement qui ne stagne pas ou ne rend pas la reine gagne, donc vous avez besoin d'un mécanisme pour conduire vers échec et mat, plutôt que de simplement se déplacer au hasard et de dire: "Wow, je vais totalement pour gagner cela - presque chaque mouvement gagne! "

David Richerby
la source
Excellente réponse! Je n'ai jamais entendu parler de cet "effet d'horizon", ça fait beaucoup de sens, très intéressant.
Pedro A
Merci pour les clarifications. Je suis surtout dans la brume concernant le grand impact d'un seul mouvement, mais je suppose que le temps que l'ordinateur est autorisé à analyser est assez limité sur le site Web en question, ce qui rend l'effet important.
jonasfh
4

Il n'y a aucune incohérence. Lorsque vous effectuez un mouvement, l'ordinateur n'a plus à rechercher la position précédente. Il peut désormais concentrer toute la puissance de traitement dans la nouvelle position, et donc l'évaluation peut changer. L'arbre à gibier pourrait être très différent.

C'est comme la façon dont nous jouons aux échecs.

Bonjour le monde
la source
4
Vous pouvez ajouter à cela que le moteur d'échecs en ligne n'analyse pas beaucoup de mouvements en profondeur pour que le pli supplémentaire soit beaucoup plus important qu'il ne le serait sur votre ordinateur à la maison.
Brian Towers
Hmmm, je suis en quelque sorte d'accord. Pourtant, je suis curieux que l'impact soit si important pour un seul coup. Je suppose que l'ordinateur fait une analyse assez importante pour chaque prochain mouvement possible, en particulier les prometteurs, et il devrait découvrir si l'un des mouvements possibles donnera une position bien meilleure et ajustera la position actuelle en conséquence. Mais je vois le commentaire de Brian, qui doit être important ici.
jonasfh