Je parie avec un collègue que sur 50 parties de ping-pong (le premier à avoir gagné 21 points, une victoire par 2), je gagnerai les 50. Jusqu'à présent, nous avons disputé 15 parties et en moyenne je gagne 58% des les points, plus j'ai gagné tous les jeux jusqu'à présent. Nous nous demandons donc si j'ai 58% de chances de gagner un point et s'il a 42% de chances de gagner un point, quel est le pourcentage de chance que je gagne le match? Existe-t-il une formule permettant de saisir la différence de% de chances?
Nous avons cherché sur Google et avons même demandé aux experts en informatique de notre société, mais nous n'avons pas trouvé de réponse directe.
Edit: Wow, je suis époustouflé par la minutie des réponses. Merci beaucoup à vous tous!!! Au cas où les gens seraient curieux, j’aurai une mise à jour de l’avancement de mon pari: j’ai maintenant gagné 18 parties sur 50, je dois donc gagner 32 parties de plus. J'ai gagné 58,7% de tous les points et mon adversaire a donc gagné 41,3% des points. L'écart type pour mon adversaire est de 3,52, son score moyen est de 14,83 et son score médian est de 15,50. Vous trouverez ci-dessous une capture d'écran du score de chaque jeu jusqu'à présent. Je peux garder la mise à jour au fur et à mesure que le pari se poursuit, si les gens sont intéressés.
Edit # 2 : Malheureusement, nous n’avons pu jouer qu’à quelques jeux supplémentaires, voici les résultats. Je vais juste continuer à remplacer la photo pour ne pas avoir quelques captures d'écran de la partition.
Dernière mise à jour : j'ai finalement perdu contre mon collègue au jeu n ° 28. Il m'a battu 21-13. Merci pour toute votre aide!
la source
Réponses:
L'analyse est compliquée par la perspective que le jeu passe en "prolongation" afin de gagner avec une marge d'au moins deux points. (Sinon, ce serait aussi simple que la solution présentée à l' adresse https://stats.stackexchange.com/a/327015/919 .) Je montrerai comment visualiser le problème et comment l'utiliser pour le décomposer en contributions faciles à calculer: la réponse. Le résultat, bien qu'un peu brouillon, est gérable. Une simulation confirme son exactitude.
Soit votre probabilité de gagner un point.p Supposons que tous les points sont indépendants. La chance que vous gagnez une partie peut être décomposée en événements (non-interchangeables) en fonction du nombre de points que votre adversaire a à la fin en supposant que vous n'effectuez pas de temps supplémentaire ( ) ou que vous le faites en temps supplémentaire. Dans ce dernier cas, il est (ou deviendra) évident que, à un moment donné, le score était de 20-20.0 , 1 , … , 19
Il y a une belle visualisation. Laissez les scores de la partie sous forme de points où x est votre score et y le score de votre adversaire. Au fur et à mesure du déroulement du jeu, les scores se déplacent le long du réseau entier du premier quadrant commençant à ( 0 , 0 ) , créant ainsi un chemin de jeu . Il se termine la première fois que l’un d’entre vous a marqué au moins 21 et a une marge d’au moins 2 . Ces points gagnants forment deux ensembles de points, la "limite d'absorption" de ce processus, à laquelle le chemin de jeu doit se terminer.( x , y) X y ( 0 , 0 ) 21 2
Cette figure montre une partie de la limite d'absorption (elle s'étend infiniment vers le haut et vers la droite) ainsi que le tracé d'un match en prolongation (avec une perte pour vous, hélas).
Comptons. Le nombre de façons dont le jeu peut se terminer avec des points pour votre adversaire est le nombre de chemins distincts dans le réseau entier de scores ( x , y ) commençant au score initial ( 0 , 0 ) et se terminant à l'avant-dernier score ( 20 , y ) . Ces chemins sont déterminés par lequel des 20 + y points du jeu que vous avez gagnés. Ils correspondent donc aux sous-ensembles de taille 20 des nombres 1 , 2 , … , 20 +y ( x , y) ( 0 , 0 ) ( 20 , y) 20 + y 20 , et il y a ( 20 + y1 , 2 , … , 20 + y d'entre eux. Etant donnédans chaque cheminvous avez gagné21points(avecprobabilités indépendantespchaque fois,comptant le dernier point) et votre adversaire gagnéypoints (avecprobabilités indépendantes1-pchaque fois), les chemins associés àycompte pourune chance total de( 20+y20) 21 p y 1 - p y
De même, il y a façons d’arriver à(20,20)représentant le match nul 20-20. Dans cette situation, vous n'avez pas de victoire définitive. Nous pouvons calculer les chances de votre victoire en adoptant une convention commune: oubliez le nombre de points marqués jusqu'à présent et commencez à suivre le différentiel de points. Le jeu est à un différentiel de0et se terminera quand il atteindra pour la première fois+2ou-2, en passant nécessairement par±1 encours de route. Soitg(i)la chance que tu gagnes quand le différentiel esti∈{-1( 20+2020) ( 20 , 20 ) 0 + 2 - 2 ± 1 g( i ) .i ∈ { - 1 , 0 , 1 }
Puisque votre chance de gagner dans n'importe quelle situation est , nous avonsp
La solution unique à ce système d’équations linéaires pour le vecteur implique( g( - 1 ) , g( 0 ) , g( 1 ) )
C’est donc votre chance de gagner une fois atteinte (ce qui se produit avec une chance de ( 20 + 20)(20,20) ).(20+2020)p20(1−p)20
Par conséquent, votre chance de gagner est la somme de toutes ces possibilités disjointes, égale à
Le contenu entre les parenthèses sur la droite est un polynôme dans . (Il semble que son degré soit égal à 21 , mais les termes principaux s’annulent tous: son degré est égal à 20. )p 21 20
Lorsque , les chances de gagner sont proches de 0,855913992.p = 0,58 0,855913992.
Vous ne devriez pas avoir de difficulté à généraliser cette analyse aux jeux qui se terminent par un nombre de points quelconque. Lorsque la marge requise est supérieure à le résultat devient plus compliqué mais reste tout aussi simple.2
Incidemment , avec ces chances de gagner, vous aviez chances de gagner les 15 premiers matchs. Cela n’est pas incompatible avec ce que vous rapportez, ce qui pourrait nous encourager à continuer à supposer que les résultats de chaque point sont indépendants. Nous projeterions ainsi que vous avez une chance de( 0.8559 … )15≈ 9,7 % 15
de remporter tous les jeux restants , en supposant qu'ils procèdent en fonction de toutes ces hypothèses. Cela ne semble pas être un bon pari, à moins que le gain soit important!35
J'aime vérifier un travail comme celui-ci avec une simulation rapide. Voici le
R
code pour générer des dizaines de milliers de jeux en une seconde. Cela suppose que le jeu sera terminé dans un délai de 126 points (extrêmement peu de jeux ont besoin de continuer aussi longtemps, cette hypothèse n'a donc aucun effet matériel sur les résultats).Quand j’ai couru ça, vous avez gagné dans 8 570 cas sur 10 000 itérations. Un score Z (avec approximativement une distribution normale) peut être calculé pour tester de tels résultats:
La valeur de dans cette simulation est parfaitement cohérente avec le calcul théorique précédent.0,31
Annexe 1
À la lumière de la mise à jour de la question, qui répertorie les résultats des 18 premiers jeux, voici des reconstructions de chemins de jeu cohérents avec ces données. Vous pouvez voir que deux ou trois des jeux ont été dangereusement proches des pertes. (Tout chemin se terminant sur un carré gris clair est une perte pour vous.)
Les utilisations potentielles de cette figure incluent:
Les chemins se concentrent autour d'une pente donnée par le ratio 267: 380 du total des scores, soit environ 58,7%.
La dispersion des chemins autour de cette pente montre la variation attendue lorsque les points sont indépendants.
Si les points sont faits en traînées, les trajectoires individuelles auront tendance à avoir de longues étendues verticales et horizontales.
Dans une série plus longue de jeux similaires, attendez-vous à voir des chemins qui tendent à rester dans la plage colorée, mais attendez-vous également à ce que quelques-uns s'étendent au-delà.
La perspective d’une ou deux parties dont le chemin se situe généralement au-dessus de cet écart indique la possibilité que votre adversaire finisse par gagner une partie, probablement le plus tôt possible.
Annexe 2
Le code pour créer la figure a été demandé. La voici (nettoyée pour produire un graphique légèrement plus joli).
la source
r code
divulgation de la mise en oeuvre? Merci beaucoup.En utilisant la distribution binomiale et en supposant que chaque point est indépendant:
la source
Je suis allé avec une réponse informatique. Voici une fonction R qui simule un jeu de ping-pong dans lequel le gagnant doit gagner par 2. Le seul argument est la probabilité que vous gagniez un point. Il retournera le score final de ce jeu:
Commençons par nous assurer que cela fonctionne en simulant 10 000 jeux dans lesquels vous avez 50% de chances de gagner chaque point. Nous devrions observer que votre pourcentage de victoire est d'environ 50%:
Cela renvoie .4955, à propos de ce à quoi nous nous attendions. Alors connectons vos 58%:
Cela retourne 0,8606. Vous avez donc environ 86,06% de chances de gagner une partie.
Nous pouvons maintenant simuler 35 lots de jeu et voir combien de fois vous gagneriez tous les 35:
Cela renvoie 0,0037, ce qui signifie que vous avez environ 0,37% de chances de gagner les 35 prochains matchs. Cela suppose que tous les jeux et tous les points sont indépendants les uns des autres. Vous pouvez programmer cela explicitement dans la fonction ci-dessus, si vous le souhaitez.
Note: Je fais ça à la volée. Je suis sûr qu'il existe un moyen de programmation plus efficace sur le plan informatique.
la source
pbetterwins <- pbinom(19,40,0.42) + dbinom(20,40,0.42) * 0.58^2/(0.58^2+0.42^2); pbetterwins; pbetterwins^35
un calcul en utilisant la distribution binomiale. Assez proche de votre simulationDevons-nous supposer que les 58% de chances de gagner sont fixes et que les points sont indépendants?
Je pense que la réponse de Whuber est bonne , et bien écrite et expliquée, lorsque l’on tient compte du fait que chaque point est indépendant du point suivant . Cependant, je pense que, dans la pratique, ce n’est qu’un point de départ intéressant (théorique / idéalisé). J'imagine qu'en réalité, les points ne sont pas indépendants les uns des autres, ce qui peut rendre plus ou moins probable que votre collègue adversaire remporte une victoire au moins une fois sur 50.
Au début, j’imaginais que la dépendance des points serait un processus aléatoire , c’est-à-dire non contrôlé par les joueurs (par exemple, lorsque l’on gagne ou que l'on perd de jouer différemment), ce qui devrait créer une plus grande dispersion des résultats, ce qui profiterait au joueur inférieur. celui-ci pointe sur cinquante.
Une seconde réflexion pourrait toutefois suggérer le contraire : le fait que vous ayez déjà "atteint" quelque chose avec 9,7% de chance peut donner un avantage (mais seulement minime), du point de vue bayésien, aux idées sur les mécanismes favorisant gagnez plus de 85% de chances de gagner une partie (ou du moins, réduisez le risque que votre adversaire ait une probabilité beaucoup plus élevée que 15%, comme indiqué dans les deux paragraphes précédents). Par exemple, il se peut que vous obteniez de meilleurs résultats lorsque votre position est moins bonne (il n’est pas étonnant que les personnes marquant des scores beaucoup plus différents sur les points de match, favorables ou défavorables, que sur les points ordinaires). Vous pouvez améliorer les estimations des 85% en tenant compte de cette dynamique et vous avez probablement plus de 85% de chances de gagner une partie.
Quoi qu’il en soit, il pourrait être très erroné d’utiliser cette simple statistique de points pour fournir une réponse. Oui, vous pouvez le faire, mais ce ne sera pas correct car les prémisses (indépendance des points) ne sont pas nécessairement correctes et influencent grandement la réponse . La statistique 42/58 donne plus d’informations mais nous ne savons pas très bien comment l’utiliser (la justesse du modèle) et son utilisation pourrait fournir des réponses d’une grande précision qu’elle n’a pas réellement.
Exemple
Exemple: un modèle tout aussi raisonnable avec un résultat complètement différent
Donc, la question hypothétique (supposant des points indépendants et des probabilités théoriques connues pour ces points) est en elle-même intéressante et on peut y répondre, mais juste pour être ennuyeuse et sceptique / cynique; une réponse au cas hypothétique ne concerne pas tellement votre problème sous-jacent / original, et pourrait expliquer pourquoi les statisticiens / informaticiens de votre société hésitent à donner une réponse claire.
Juste pour donner un exemple alternatif (pas nécessairement meilleur) qui fournit une déclaration (contre-) déroutante "Q: quelle est la probabilité de gagner la totalité des 50 parties si je gagne déjà 15?" Si nous ne commençons pas à penser que «les points 42/58 sont pertinents ou nous donnent de meilleures prédictions», nous commencerions alors à prédire votre probabilité de gagner le jeu et les prédictions de gagner 35 autres jeux uniquement sur la base de vos gains précédents. 15 jeux:
ce qui signifie que je ne serais pas aussi pessimiste que la simple prédiction de 0,432%. Le fait que vous ayez déjà remporté 15 matchs devrait augmenter la probabilité de gagner les 35 prochains matchs.
Note basée sur les nouvelles données
Estimation du maximum de vraisemblance pour les paramètres de la distribution bêta à la place d'une chance de gain fixée à 58%:
Q: comment lire le graphique "LogLikelihood pour les paramètres mu et nu"?
UNE:
code / calcul pour le graphique 1
code / calcul pour le graphique 2
la source
Beaucoup d'efforts pourraient être consacrés à un modèle parfait. Mais parfois, un mauvais modèle, c'est mieux. Et rien ne dit mauvais modèle comme le théorème limite centrale - tout est une courbe normale.
Nous allons ignorer les "heures supplémentaires". Nous modéliserons la somme des points individuels sous forme de courbe normale. Nous modéliserons en jouant 38 tours et celui qui a le plus de points gagne, au lieu du premier à 20. C'est assez similaire au point de vue du jeu!
Et aveuglément, je dirai que nous nous approchons de la bonne réponse.
la source
Sur la base de la simulation, la probabilité de gagner n’importe quel jeu est d’environ 85,5%.
La probabilité de gagner exactement 2 (c'est ainsi que je lis le titre, mais cela ne semble pas être ce que vous demandez) est d'environ 10,1%.
Exécutez le code ci-dessous.
la source
dbinom(20,40,0.58)*0.58^2/(1-2*0.58+2*0.58^2)+dbinom(20,39,0.58)*0.58
donner 10,04%