Combien de fois dois-je lancer un dé pour évaluer son équité en toute confiance?

22

(Excuses à l'avance pour l'utilisation du langage profane plutôt que du langage statistique.)

Si je veux mesurer les chances de lancer chaque côté d'un dé physique à six faces spécifique à +/- 2% près avec une certitude raisonnable, combien de rouleaux d'échantillons seraient nécessaires?

c'est-à-dire combien de fois aurais-je besoin de lancer un dé, en comptant chaque résultat, pour être sûr à 98% que les chances qu'il lance chaque côté se situent entre 14,6% et 18,7%? (Ou certains critères similaires où l'on serait à environ 98% sûr que le dé est juste à 2% près.)

(Il s'agit d'une préoccupation réelle pour les jeux de simulation utilisant des dés et voulant être sûr que certains modèles de dés ont une probabilité acceptable de 1/6 de lancer chaque nombre. Certains prétendent que de nombreux modèles de dés courants ont été mesurés en roulant 29% 1 par lancer plusieurs de ces dés 1000 fois chacun.)

Dronz
la source
1
C'est beaucoup plus délicat que de trouver l'intervalle de confiance pour un binôme, car vous voudriez garder toutes les probabilités sous contrôle. Jetez un œil à l'article de Hsiuying Wang sur les intervalles de confiance simultanés pour les distributions multinomiales ( Journal of Multivariate Analysis 2008, 99, 5, 896-911). Vous pouvez trouver du code dans ce billet de blog , qui donne également un bref résumé sur certains des travaux qui ont été effectués à ce sujet.
idnavid
1
Notez que si vous êtes simplement intéressé à vérifier si les 1 sont roulés une bonne partie du temps, cela simplifie beaucoup la question.
Dennis Jaheruddin
2
Il est important de noter que «l'intervalle de confiance» ne vous donne pas une «probabilité en centile d'être correct». Je soupçonne que vous utilisez l'utilisation courante très raisonnable du terme "98% sûr", mais vous devez savoir à chaque fois que quelqu'un mentionne un "intervalle de confiance" qui n'est pas du tout identique à une probabilité de 98%: link.springer.com/ article / 10.3758% 2Fs13423-013-0572-3
BrianH
1
@BrianH Merci! Je ne parlais pas seulement de l'expression familière, mais je cherche à quantifier la certitude impliquée par le test. Il me semble que de la même manière qu'il est logique de dire que je m'attends à lancer un résultat de dé un pourcentage calculable du temps, qu'il y aurait un calcul similaire (mais plus complexe) pour la probabilité que je fasse des résultats à l'intérieur une certaine marge d'erreur dans I roll n times, c'est ce que je pense comprendre la réponse de Xiamoi (et le commentaire de suivi). Oui?
Dronz
1
@Dronz Pour être juste, c'est une de ces choses qui, selon vous, seraient plus simples qu'elles ne le sont en réalité. Diablement délicat, en fait. Voici quelques questions clés connexes ailleurs pour vous donner une idée de la façon dont il n'y a pas de réponse incroyablement simple: Frequentist math.stackexchange.com/questions/1578932/… Bayesian math.stackexchange.com/questions/1584833/… et amusant: rpg.stackexchange.com/questions/70802/…
BrianH

Réponses:

18

TL; DR: si p = 1/6 et que vous voulez savoir quelle taille n doit être de 98%, que les dés sont corrects (à 2% près), n doit être au moins n ≥ 766 .


Soit n le nombre de rouleaux et X le nombre de rouleaux qui atterrissent sur un côté spécifié. Alors X suit une distribution binomiale (n, p) où p est la probabilité d'obtenir ce côté spécifié.

Par le théorème central limite, nous savons que

n(X/np)N(0,p(1p))

Puisque X/n est la moyenne de l'échantillon de n variables aléatoires de Bernoulli (p) . Par conséquent, pour les grands n , les intervalles de confiance pour p peuvent être construits comme

Xn±Zp(1p)n

Puisque p est inconnu, on peut le remplacer par le moyen de l' échantillon p = X / n , et par divers théorèmes de convergence, nous savons que l'intervalle de confiance résultant sera asymptotiquement valide. Nous obtenons donc des intervalles de confiance de la formep^=X/n

p^±Zp^(1-p^)n

avec p = X / n . Je suppose que vous savez ce que sont les scores Z. Par exemple, si vous voulez un intervalle de confiance à 95%, vous prenez Z = 1,96 . Donc, pour un niveau de confiance donné α, nous avonsp^=X/nZZ=1.96α

p^±Zαp^(1-p^)n

Supposons maintenant que vous vouliez que cet intervalle de confiance soit d'une longueur inférieure à Cα et que vous souhaitiez connaître la taille d'un échantillon dont nous avons besoin pour faire ce cas. Eh bien, cela équivaut à demander ce que nα satisfait

Zαp^(1-p^)nαCα2

Qui est ensuite résolu pour obtenir

nα(2ZαCα)2p^(1-p^)

Donc bouchon dans vos valeurs de Zα , Cα , et d' environ p pour obtenir une estimation pour n αp^nαpn

Xiaomi
la source
3
Merci. Comme je n'ai pas fait de mathématiques de niveau collégial depuis des décennies, pourrais-je vous déranger à brancher les chiffres et à me donner un nombre approximatif de fois que je devrais lancer un dé, comme un entier?
Dronz
9
p=1/6nnn766Cα
4
Il pourrait être plus intéressant de regarder la distribution multinomiale, puisque maintenant nous testons séparément chaque côté. Cela ne prend pas en compte toutes les informations dont nous disposons sur le problème. Pour un look d'explication à intiuitive stat.berkeley.edu/~stark/SticiGui/Text/chiSquare.htm
Jan
5
Je suis d'accord avec @Jan: Cette réponse ne répond pas à la question. De plus, il ne peut pas être facilement adapté pour construire une réponse en l'appliquant séparément aux six faces, car les six tests sont interdépendants.
whuber
3
C'est une bonne réponse, mais je suis entièrement d'accord avec @Jan, whuber. Cette question mérite une réponse basée sur la statistique du chi carré et la distribution multinomiale.
Łukasz Grad