(Excuses à l'avance pour l'utilisation du langage profane plutôt que du langage statistique.)
Si je veux mesurer les chances de lancer chaque côté d'un dé physique à six faces spécifique à +/- 2% près avec une certitude raisonnable, combien de rouleaux d'échantillons seraient nécessaires?
c'est-à-dire combien de fois aurais-je besoin de lancer un dé, en comptant chaque résultat, pour être sûr à 98% que les chances qu'il lance chaque côté se situent entre 14,6% et 18,7%? (Ou certains critères similaires où l'on serait à environ 98% sûr que le dé est juste à 2% près.)
(Il s'agit d'une préoccupation réelle pour les jeux de simulation utilisant des dés et voulant être sûr que certains modèles de dés ont une probabilité acceptable de 1/6 de lancer chaque nombre. Certains prétendent que de nombreux modèles de dés courants ont été mesurés en roulant 29% 1 par lancer plusieurs de ces dés 1000 fois chacun.)
la source
Réponses:
TL; DR: sip = 1/6 et que vous voulez savoir quelle taille n doit être de 98%, que les dés sont corrects (à 2% près), n doit être au moins n ≥ 766 .
Soitn le nombre de rouleaux et X le nombre de rouleaux qui atterrissent sur un côté spécifié. Alors X suit une distribution binomiale (n, p) où p est la probabilité d'obtenir ce côté spécifié.
Par le théorème central limite, nous savons que
PuisqueX/n est la moyenne de l'échantillon de n variables aléatoires de Bernoulli (p) . Par conséquent, pour les grands n , les intervalles de confiance pour p peuvent être construits comme
Puisquep est inconnu, on peut le remplacer par le moyen de l' échantillon p = X / n , et par divers théorèmes de convergence, nous savons que l'intervalle de confiance résultant sera asymptotiquement valide. Nous obtenons donc des intervalles de confiance de la formep^= X/ n
avec p = X / n . Je suppose que vous savez ce que sont les scores Z. Par exemple, si vous voulez un intervalle de confiance à 95%, vous prenez Z = 1,96 . Donc, pour un niveau de confiance donné α, nous avonsp^= X/ n Z Z=1.96 α
Supposons maintenant que vous vouliez que cet intervalle de confiance soit d'une longueur inférieure àCα et que vous souhaitiez connaître la taille d'un échantillon dont nous avons besoin pour faire ce cas. Eh bien, cela équivaut à demander ce que nα satisfait
Qui est ensuite résolu pour obtenir
Donc bouchon dans vos valeurs deZα , Cα , et d' environ p pour obtenir une estimation pour n αp^ nα p n
la source