Mauvaise évaluation du stockfish

15

Ceci est l'étude

NN - NN

Comme vous pouvez le voir, Stockfish donne une victoire décisive absolue pour les noirs, bien que ce soit clairement un match nul !!

Vérifiez vous-même

c4 + est un coup perdu, tandis que Ba4 + est le bon.

Que se passe-t-il? Ne stockfish prendre en considération les positions fermée du tout ?

William Kinaan
la source
5
Il y a beaucoup de positions que Stockfish n'évalue pas correctement (y compris certaines finales courantes).
Qudit
10
Arrive tout le temps! C'est un logiciel, pas un Dieu
David
4
Cela me ferait très plaisir de voir un scénario dans la même veine qui est complètement faux par AlphaZero ou Leela Zero!
leftaroundabout
1
@Qudit: Oui. Je faisais simplement remarquer que la question devait se concentrer précisément sur cet aspect, plutôt que de partir de la position telle qu’elle avait été donnée. Désolé si je n'ai pas précisé cela.
TonyK
3
@leftaroundabout Leela évalue également les forteresses tout le temps, voir par exemple la fin de ce jeu du TCEC Sufi: cd.tcecbeta.club/archive.html?season=15&div=sf&game=31 . En fait, sans doute Leela évalue-t-il encore plus que Stockfish, car assez souvent, il aura une valeur non nulle tandis que Stockfish affiche stoïquement 0,00, et il faut du temps avant que Leela réalise que l'adversaire ne le laisse pas gagner.
Allure

Réponses:

25

Stockfish n'est pas une entité parfaite pour jouer aux échecs, et vous avez trouvé une position où il est incapable de dire qu'il s'agit d'un match nul (au moins jusqu'à ce que la règle des 50 coups entre en jeu et l'aide à tailler). Ces positions sont appelées " forteresses ". Vous pouvez voir que cela se produit car même si vous saisissez la solution, Stockfish évalue toujours la position finale à -10 ou plus. Ces positions de forteresse où Stockfish est mort mal sont rares, mais elles existent, et c'est l'une d'entre elles.

Il y a eu diverses tentatives pour écrire du code de détection de forteresse dans Stockfish et d'autres moteurs conventionnels qui sont censés reconnaître les forteresses et empêcher Stockfish de se diriger vers elles si sa position est supérieure. Si vous avez une idée intelligente, vous pouvez probablement la publier dans une revue académique (voir les publications dans le wiki de programmation d'échecs).

Séduire
la source
11

Cela aide à comprendre que les moteurs ne sortent pas vraiment de la «stratégie», tant qu'ils regardent plusieurs mouvements dans le futur, évaluent le score de la position et trouvent le jeu de mouvements optimal.

La grande faiblesse de cette approche est que si rien ne peut arriver rapidement, le moteur va avoir des problèmes. C'était un énorme problème avec les finales. Si vous avez un K + B + P vs K + P, vous ne résolvez pas cette position en quelques mouvements. Le correctif consistait donc à ajouter des bases de table de fin de partie aux moteurs - il suffit de calculer par bruteforce chaque position de fin de partie à l'avance et de les ajouter en tant que bibliothèque à utiliser par le moteur. (C'est pourquoi, dans la plupart des applications d'échecs bon marché, vous pouvez gagner une victoire simplement en survivant jusqu'à la fin du jeu: car il n'a pas de base de table de fin de partie.)

Mais votre position ne sera (naturellement) pas dans une base de table de fin de partie. Le stockfish doit donc jouer des millions de positions, s'étendant sur une dizaine de mouvements dans le futur ... seulement pour constater que dans chacun d'eux, le noir est substantiellement en hausse. Il ne peut certainement pas jouer ~ 56 coups pour l'arbre de décision complet - c'est ce qu'il faudrait pour déterminer un tirage définitif.

Kevin
la source
0

Les autres réponses couvrent bien cette question, mais il est intéressant de noter que tous les programmes ne comprennent pas qu'il s'agit d'un tirage au sort. Je l'ai branché sur mon ordinateur et en tant que membre ChessBase Premium, j'ai également accès à des moteurs cloud.

L'un de ces moteurs cloud a évalué cela comme un tirage presque instantanément. Je souhaite seulement qu'il y ait plus d'informations que simplement "Nouveau moteur".

entrez la description de l'image ici

PhishMaster
la source