Pourquoi le système de notation Elo utilise-t-il une mauvaise règle de mise à jour?

10

Le système de notation Elo utilise un algorithme de minimisation de descente de gradient de la fonction de perte d'entropie croisée entre la probabilité attendue et observée d'un résultat dans des comparaisons appariées. Nous pouvons écrire les fonctions de perte générales comme

E=n,ipiLog(qi)

où la somme est effectuée sur tous les résultats et tous les adversaires n . p i est la fréquence observée de l'événement i et q i la fréquence attendue.inpiiqi

Dans le cas de seulement deux résultats possibles (gagnant ou perdant) et un adversaire, nous avons

E=pLog(q)(1p)Log(1q)

Si est le classement du joueur i et π j est le classement du joueur j on peut construire la probabilité attendue comme q i = e π iπiiπjj qj=e π j

qi=eπieπi+eπj
alors la règle de mise à jour de la descente de gradient indique l'utilisation
qj=eπjeπi+eπj

πi=πiη(qipi)

πj=πjη(qjpj)

et p i sont la probabilité de victoire attendue et observée du joueur i contre le joueur j . Ce sont les règles de mise à jour.qipiijtwo outcomes

En présence de tirages, nous pouvons généraliser le modèle ci-dessus, y compris et troisième résultat avec probabilité

qi(w)=eπi

q(d)=νeπi+πj2eπi+eπj+νeπi+πj2
qj(w)=eπj
qi(w)=eπieπi+eπj+νeπi+πj2
qj(w)=eπjeπi+eπj+νeπi+πj2

Et nous pouvons construire la fonction de perte comme

E=p(w)Log(q(w))(1p(w)p(d))Log(q(l))p(d)Log(q(d))

p(w),p(l),p(d)winloosedrawq(w),q(l),q(d)winloosedraw

πi=πiη(qi(w)+qi(d)2pi(w)pi(d)2)

πj=πjη(qj(w)+qj(d)2pj(w)pj(d)2)

qj(w)qj(d)ijpi(w)pi(d)ijthree outcome

La question est, pourquoi le système de notation Elo utilise-t-il les two outcomesrègles de mise à jour même en présence de tirages?

emanuele
la source

Réponses:

3

La probabilité de dessiner, par opposition à un résultat décisif, n'est pas spécifiée dans le système Elo. Au lieu de cela, un match nul est considéré - à la fois dans la performance attendue et dans le résultat du match - la moitié d'une victoire et la moitié d'une défaite.

Un exemple tiré de la page Elo de Wikipedia : "Le score attendu d'un joueur est sa probabilité de gagner plus la moitié de sa probabilité de dessiner. Ainsi, un score attendu de 0,75 pourrait représenter 75% de chances de gagner, 25% de chances de perdre et 0% de chances. de l'autre côté, cela pourrait représenter 50% de chances de gagner, 0% de chances de perdre et 50% de chances de tirer. "

two outcomeRA=RA+K(SAEA)SA=1(nw+0.5nd)+0(0.5nd+nl)SA=1SA=0.5SA=0

Comme Elo, le système Glicko ne modélise pas les tirages mais il fait une mise à jour comme la moyenne d'une victoire et d'une défaite (par joueur). Au lieu de cela, dans le système de classement TrueSkill , "les tirages sont modélisés en supposant que la différence de performances dans un jeu particulier est faible. Par conséquent, les chances de tirer ne dépendent que de la différence de la force de jeu des deux joueurs. des échecs montrent que les tirages sont plus probables entre les joueurs professionnels que les débutants. Par conséquent, les chances de tirer semblent également dépendre du niveau de compétence. "

Cette approche nécessite une modélisation spécifique différente pour chaque jeu (et TrueSkill est appliqué à quelques jeux Microsoft Xbox), donc il convient à Elo et Glicko (conçu uniquement pour les échecs), et ce n'est pas pour Rankade , notre système de classement polyvalent.

Tomaso Neri
la source
"Le score attendu d'un joueur est sa probabilité de gagner plus la moitié de sa probabilité de tirer." c'est exactement ce que j'ai trouvé dans la formule ci-dessus. Quoi qu'il en soit, dans la formule de mise à jour d'Elo, la moitié de la probabilité de tirage n'est pas spécifiée comme vous le signalez. La question demeure, pourquoi dans le système de classement Elo, nous ne nous soucions pas des tirages?
emanuele
1
Vous pouvez toujours exprimer le score attendu comme la chance de gagner et la chance de perdre (et zéro chance de tirer - voir le premier exemple de Wikipedia). Dans ce cas, «le score attendu d'un joueur est sa probabilité de gagner» (et rien de plus, car la moitié de la probabilité de tirer est nulle). Après un seul match, le résultat est une victoire, ou une perte, ou la moitié d'une victoire. Même si vous avez un jeu dans lequel les tirages sont autorisés, vous pouvez mettre à jour le score Elo en utilisant simplement une combinaison de victoire et de perte, comme si les tirages n'avaient aucune chance.
Tomaso Neri