Dois-je utiliser un cdf binomial ou un cdf normal lors du retournement de pièces?

11

Une pièce doit être testée pour l'équité. 30 têtes arrivent après 50 flips. En supposant que la pièce soit juste, quelle est la probabilité que vous obteniez au moins 30 têtes en 50 flips?

Selon mon professeur, la bonne façon de résoudre ce problème est de faire

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

Cependant, j'ai pris une fonction de distribution cumulative binomiale comme celle-ci

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

Je crois que les critères d'une distribution binomiale sont satisfaits: les événements individuels sont indépendants, il n'y a que deux issues possibles (têtes vs queues), la probabilité est constante pour la question (0,5), et le nombre d'essais est fixé à 50 Pourtant, évidemment, les deux méthodes donnent des réponses différentes, et une simulation prend en charge ma réponse (au moins les quelques fois où je l'ai exécutée; évidemment, je ne peux pas garantir que vous obtiendriez les mêmes résultats).

Mon professeur a-t-il tort de supposer qu'une courbe de distribution normale serait également un moyen valide de résoudre ce problème (à aucun moment, il n'est dit que la distribution est normale, mais n * p et n * (1-p) sont tous deux supérieurs à 10), ou ai-je mal compris quelque chose à propos des distributions binomiales?

waiwai933
la source
5
Une personne expérimentée dans l'utilisation d'approximations normales du binôme procéderait un peu différemment: elle appliquerait la correction de continuité (habituelle) , comme dans 1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))(il s'agit d'une expression R), dont la valeur est de 0,1015, en accord assez étroit avec le cdf binomial .
whuber

Réponses:

10

Voici une illustration des réponses de whuber et onestop.

correction de continuité

En rouge la distribution binomiale , en noir la densité de l'approximation normale , et en bleu la surface correspondant à pour .Bin(50,0.5)N(25,12.5)P(Y>29.5)YN(25,12.5)

La hauteur d'une barre rouge correspondant à pour est bien approximée par . Pour obtenir une bonne approximation de , vous devez utiliser .P(X=k)XBin(50,0.5)P(X30)P(Y>29,5)P(k12<Y<k+12)P(X30)P(Y>29.5)

(modifier) ​​Il s'agit de (obtenu dans R par ) alors que l'approximation est correcte.P ( X 30 ) 0,1013194 :

P(Y>29.5)0.1015459,
1-pnorm(29.5,25,sqrt(12.5))
P(X30)0.1013194:

C'est ce qu'on appelle la correction de continuité . Il vous permet de calculer même des "probabilités ponctuelles" comme : P(X=22)

P(X=22)=(5022)0.5220.5280.07882567,P(21.5<Y<22.5)0.23975010.16109940.07865066.
Elvis
la source
4

La distribution normale donne une approximation plus proche du binôme si vous utilisez une correction de continuité . En utilisant ceci pour votre exemple, j'obtiens 0.1015. Comme ce sont des devoirs, je vous laisse le soin de remplir les détails.

un arrêt
la source
4

Considère ceci. Dans la distribution binomiale discrète, vous avez des probabilités réelles pour des nombres individuels. Dans la normale continue qui n'est pas le cas, vous avez besoin d'une plage de valeurs. Donc ... si vous deviez approximer la probabilité d'une valeur individuelle, disons X, à partir du binôme avec la normale, comment feriez-vous cela? Regardez un histogramme de probabilité de la distribution binomiale avec la courbe normale posée dessus. Vous devez en fait sélectionner X ± 0,5 pour capturer quelque chose de similaire à la probabilité binomiale de X avec l'approximation normale.

Maintenant, étendez cela à lorsque vous sélectionnez une queue de la distribution. Lorsque vous utilisez la méthode binomiale, vous sélectionnez la probabilité de votre valeur entière (30 dans votre cas) plus tout ce qui est plus élevé. Par conséquent, lorsque vous effectuez le continu, vous devez vous assurer de capturer cela et de sélectionner également 0,5 de moins, de sorte que la coupure de la distribution continue est de 29,5.

John
la source
3
En fait, la question montre une compréhension réfléchie du problème et ne semble pas chercher une réponse à une question de devoirs de routine. Bien qu'il s'agisse de devoirs étiquetés , pensez à faire une exception ici. En particulier, une bonne discussion sur l'utilisation de la distribution normale pour approximer des distributions discrètes (telles que les binômes et les Poissons avec de grands N) serait appropriée et très bienvenue ici.
whuber