Pourquoi la FIDE utilise-t-elle toujours Elo?

J'ai été impressionné par le fonctionnement du système de notation Glicko . En particulier:

plus de jeux joués récemment font stabiliser votre note
moins de parties jouées récemment font fluctuer votre note jusqu'à ce que vous ayez plusieurs parties récentes à votre actif

L'USCF a modifié son système pour qu'il soit similaire il y a quelques années (où il y a une échelle mobile pour amplifier ou atténuer le changement de note pour un match donné), et maintenant que Glickman (l'inventeur de Glicko) est sur le tableau de notation de l'USCF, J'imagine qu'ils finiront par adopter un système encore plus flexible, comme le sien.

Y a-t-il une raison (autre que d'être résistante au changement, ou qu'ils n'y sont pas encore parvenus) que la FIDE n'adopte pas un système de notation plus précis?

rating fide glicko Eve Freeman
la source

Réponses:

Il n'est pas prouvé que Glicko est plus précis. Glicko résout simplement le problème d'une manière différente, avec un accent différent. Considérez que tous ces systèmes résument l'esprit humain à un nombre à 4 chiffres.

Il y a beaucoup de politique dans les cotes; c'est un sujet délicat. Si la FIDE l'adoptait, elle produirait une nouvelle liste des 100 meilleurs et beaucoup de GM seraient probablement contrariés.

Le système ELO est très facile à comprendre; la transparence est importante. Les systèmes plus complexes présentent des inconvénients immédiats.

Tony Ennis
la source

+1, bien que je ne sois pas d'accord avec le premier paragraphe, le reste est assez vrai. 1) Glicko s'est avéré être plus précis en moyenne (mesuré en fonction de la fréquence à laquelle il est capable de prédire qui gagnera un match donné). 2) Concernant l'abstraction d'un esprit humain à un nombre, ce n'est pas vraiment le cas. Il s'agit d'une mesure de compétence, de sorte que vous pouvez calculer les probabilités (pour gagner / tirer / perdre) lors de la comparaison des niveaux de compétence. Tout est soutenu par des mathématiques et des statistiques. Dans Glicko-2, il y a même un nouveau facteur de volatilité, pour les joueurs qui jouent de manière incohérente (permettant à leurs notes de fluctuer davantage).

Eve Freeman

Intéressant. Cependant, je dirais que «mieux en moyenne» n'est pas nécessairement «meilleur». Et si les moments où elle n'est pas plus précise causent un préjudice réel? Je vais aller le lire, cependant.

Tony Ennis

en.wikipedia.org/wiki/Glicko_rating_system

Tony Ennis

C'est informatif. chess.com/article/view/chess-ratings---how-they-work

Tony Ennis

Autant que je sache, le système de notation Glicko ajoute un score de fiabilité au numéro de notation, ce qui peut fournir une plus grande équité en ce qui concerne les calculs d'ajustement du score de notation. Évidemment, cela pourrait conduire à l'hypothèse erronée qu'il existe une corrélation entre jouer à des jeux notés et la force de jeu résultante (car ne pas jouer diminue le score de fiabilité qui à son tour dévalue votre numéro de notation d'une manière ou d'une autre). Je vois beaucoup de problèmes liés au score de fiabilité, même si je dois admettre que je ne suis pas un expert des subtilités du système. Pour n'en choisir que trois:

Un joueur jouant uniquement au jeu classé rare pourrait ne plus recevoir d'invitation. Imaginez que vous êtes un directeur de tournoi invitant des joueurs attrayants. Vous devez maintenant choisir entre 10 joueurs, qui ont tous le même numéro de classement, mais des numéros de fiabilité différents. Vous choisirez probablement ceux qui ont les meilleurs chiffres de fiabilité en premier. Au fil du temps, l'écart de fiabilité entre les joueurs ayant de nombreux jeux classés et moins peut augmenter.
La manipulation des numéros de notation pourrait devenir plus facile. Même le système ELO n'est pas infaillible, car certaines personnes ont obtenu des notes ou des normes IM / GM en participant à des tournois truqués. Un bon score de fiabilité peut rendre les joueurs sans score de fiabilité très bon marché - le bon joueur donne des points de notation sans perdre beaucoup lui-même. Dès qu'il y a de l'argent, être à l'abri de la triche est un problème important. J'ai l'impression que le système d'évaluation Glicko est plus sujet aux manipulations.
La communication et la compréhension de la force de jeu pourraient devenir plus difficiles pour les masses. Lorsque vous communiquez une liste de classement, vous rencontrez des problèmes. Un joueur avec une cote de 2000-50 a une "force de jeu réelle" quelque part entre 1900 et 2100. Un autre joueur a 1950-2000, ce qui se traduit par un nombre compris entre 1750 et 2150. Ainsi, le joueur avec 1950-2000 pourrait être en fait le meilleur joueur, mais sera probablement classé en dessous de l'autre, uniquement parce qu'il a joué moins de matchs ou contre des adversaires moins fiables. Vous rendez l'explication de votre système de classement plus difficile aux gens, sans vraiment garantir plus d'équité. Un MJ qui arrête de jouer pourrait gagner en «force potentielle» et se vanter de son potentiel de champion du monde, car son indice de fiabilité fait de plus en plus de place à la déviation (attention:

Pour résumer: vous obtiendrez peut-être plus que ce que vous aviez prévu, car l'ensemble du package ne vient pas seulement avec des améliorations. Et comme il y a de gros problèmes monétaires impliqués lorsque vous regardez l'extrémité supérieure des listes de classement, je ne vois pas l'intérêt de modifier un système existant.

Rayon
la source

La plupart des listes de classement ont un seuil pour le score de fiabilité (RD), plutôt que d'essayer de l'utiliser pour classer les joueurs. Un 2000 (50) serait donc toujours mieux classé qu'un 1950 (100). Selon leur cote actuelle, ils sont mieux cotés, quelle que soit la fiabilité. Si le joueur de 1950 (100) l'emportait contre le 2000 (50), sa cote augmenterait plus significativement qu'il ne le serait s'il était de 1950 (50). Pouvez-vous décrire plus en détail comment tromper le système avec Glicko? Parlez-vous de l'ensachage de votre note si vous avez un RD élevé?

Eve Freeman

@ West Freeman: Je doute que ce soit l'endroit idéal pour prouver la relative résistance à la triche d'un système de notation et je ne fais que deviner, car pour moi, il semble moins cher de manipuler le système, car je ne perdrai pas autant de points de notation moi-même quand je perds intentionnellement contre un joueur non classé. Le point le plus important de ma réponse est que vous devez vérifier un système non seulement pour l'équité du calcul, mais aussi pour la propension à tricher, la communicabilité, etc., avant de jeter un système qui fonctionne.

Ray

Mais comment augmenter artificiellement la cote de quelqu'un peut-il les aider? Habituellement, les gens qui essaient de jouer au système essaient de baisser leur cote afin de pouvoir jouer dans les sections inférieures et gagner le premier prix. Cela pourrait être plus facile avec Glicko, si vous évitez de jouer pendant une longue période, puis perdez quelques parties que vous auriez dû gagner. Mais combiné avec les planchers de notation et le fait que cela ne peut être fait que de temps en temps car le RD prend du temps à remonter.

Eve Freeman

Vous pourriez avoir besoin de notes élevées pour gagner un titre, recevoir des invitations ou être payé par les clubs pour jouer pour eux ou travailler comme entraîneur. Je parle d'échecs professionnels ici et où se trouve l'argent réel, car vous avez remis en question le comportement de la FIDE.

Ray