Comment puis-je prédire les chances qu'une équipe de ballon chasseur va gagner en fonction de l'histoire gagnante de ses joueurs?

13

Imaginez qu'il y ait 80 joueurs de ballon chasseur dans le monde. Chacun d'eux a joué des milliers de parties de ballon chasseur avec les 79 autres joueurs dans un ordre plus ou moins aléatoire. C'est un monde sans équipes (par exemple, chaque joueur a une chance d'être repêché dans l'une ou l'autre équipe à chaque match). Je connais le taux de victoires précédentes de chaque joueur (par exemple, l'un a remporté 46% de tous les jeux précédents, un autre a remporté 56% de tous ses jeux précédents). Disons qu'il y a un match à venir et je sais qui joue dans chaque équipe. Je connais également leur taux de victoire précédent.

Quelle est la meilleure façon de calculer la probabilité que chaque équipe gagne en fonction de la composition de l'équipe?

Si cela nécessite un calcul relativement avancé (par exemple, une régression logistique), faites-moi part de certains détails. Je connais assez bien SPSS, mais je n'ai pas besoin de poser de question de suivi.

De plus, comment pourrais-je explorer la précision de ma méthode à l'aide de données d'archives? Je sais que ce ne sera pas clair puisque la plupart des joueurs tournent autour de 40 à 60%, mais quand même.

Pour être précis, quelles sont les chances que l'équipe A gagne?

A - composé de personnes ayant un taux de victoire antérieur de 52%, 54%, 56%, 58%, 60% B - composé de personnes ayant un taux de victoire précédent de 48%, 55%, 56%, 58%, 60%

(Ceci est juste un exemple aléatoire à des fins d'illustration. Deux très bonnes équipes.)

Edit: Existe-t-il un moyen de commencer avec un algorithme très simple, puis de voir comment cela fonctionne? Peut-être pourrions-nous simplement additionner les pourcentages de chaque équipe et prédire que celle avec le pourcentage le plus élevé va gagner. Bien sûr, notre classement ne serait pas précis, mais sur des milliers de jeux archivés, nous pourrions voir si nous pouvons prédire mieux que le hasard.

Behacad
la source
N'est-ce pas simplement une simple division des moyennes? AvgTeam1WinP/ AvgTeam2WinP? Cela devrait donner les chances de team1gagner team2.
PascalVKooten

Réponses:

2

Cela ressemble à un travail pour les Bayes naïfs . Je ne comprends pas très bien la théorie sous-jacente, donc je ne peux malheureusement pas vous donner d'exemple, mais Bayes travaille avec des données connues (d'archivage) pour tirer des conclusions.

Je pense que Bayes n'est disponible que dans Statistic Server de SPSS, donc si vous avez accès à l'un d'entre eux, vous avez de la chance. Alternativement, vous pouvez utiliser Weka qui comprend également un tas d'autres classificateurs, alors peut-être que vous exécutez votre expérience et nous informez des résultats?

UNEUNEBUNE

rath
la source
Merci pour ton commentaire et pour ta retouche. J'ai pensé qu'une approche bayésienne ou d'apprentissage automatique pourrait être la meilleure. Malheureusement, je ne connais pas assez ces approches.
Behacad
2

Est-il exact que vous avez non seulement ces pourcentages, mais aussi tous les résultats de jeu individuels? Ensuite, je suggère le package r PlayerRatings. Ce package traite non seulement des problèmes tels que la façon de calculer la force du joueur (en utilisant des algorithmes comme elo ou glicko), mais offre également des fonctions qui peuvent prédire les résultats futurs du jeu.

Pour des exemples, consultez: http://cran.r-project.org/web/packages/PlayerRatings/vignettes/AFLRatings.pdf

rdatasculptor
la source
0

N'est-ce pas simplement une simple division des moyennes? AvgTeam1WinP/ AvgTeam2WinP? Cela devrait donner les chances de team1gagner team2.

Si je considère ce qui suit:

Si player1jouait contre player2dans des équipes "à 1", vous conviendriez que les chances que le joueur 1 gagne contre le joueur 2 seraient la probabilité que le joueur 1 gagne contre le hasard divisée par la probabilité que le joueur 2 gagne au hasard (cela ne vaut bien sûr que pour dans le cas où vous considérez que le% de gain est précis, comme dans leur limite asymptotique), simplement:

OddsP1VsP2 = WinProbabilityP1 / WinProbabilityP2 

Si vous soutenez qu'il n'y a pas d'effet d'interaction lorsque certains joueurs sont terribles et influencent ainsi le score plus négativement que prévu *, ou, si certains joueurs sont vraiment bons, ils influencent le score plus positivement que prévu **, alors il semble logique que vous puissiez il suffit de prendre la probabilité moyenne pour chaque joueur dans chaque équipe.

* Si la combinaison de 60%, 60%, 60%, 60% est considérée comme meilleure qu'une équipe de 70%, 70%, 70%, 30%, où un mauvais joueur entraînerait des cotes plus mauvaises pour l'équipe même si les moyennes sont les mêmes. Sans hypothèses supplémentaires, cette question particulière ne peut être abordée.

** De même, si 50,50,50,90 n'est pas considéré comme égal à 60,60,60,60, il en va de même.

PascalVKooten
la source