J'ai un échantillon aléatoire de variables aléatoires de Bernoulli , où sont iidrv et , et est un paramètre inconnu.X i P ( X i = 1 ) = p p
De toute évidence, on peut trouver une estimation pour : .p : = ( X 1 + ⋯ + X N ) / N
Ma question est comment puis-je construire un intervalle de confiance pour ?
confidence-interval
binomial
bernoulli-distribution
l'amibe dit de réintégrer Monica
la source
la source
Réponses:
Si la moyenne, , n’est pas proche de ou , et si la taille de l’échantillon est suffisamment grande (c.-à-d. et , la confiance l’intervalle peut être estimé par une distribution normale et l’intervalle de confiance ainsi construit: 10nn p >5n(1 - p )>5p^ 1 0 n np^>5 n(1−p^)>5
Si et , l' intervalle de confiance de est approximativement (Javanovic et Levy, 1997) ; l'inverse est valable pour . La référence aborde également l'utilisation de et (cette dernière intégrant des informations antérieures).p^=0 n>30 95% [0,3n] p^=1 n+1 n+b
Sinon, Wikipedia fournit une bonne vue d'ensemble et pointe vers Agresti et Couli (1998) et Ross (2003) pour des détails sur l'utilisation d'estimations autres que l'approximation normale, le score de Wilson, les intervalles de Clopper-Pearson ou Agresti-Coull. Celles-ci peuvent être plus précises lorsque les hypothèses ci-dessus concernant et ne sont pas satisfaites.n p^
R fournit des fonctions
binconf {Hmisc}
etbinom.confint {binom}
qui peut être utilisé de la manière suivante:Alan Agresti; Coull, Brent A. (1998). "L'approche approximative est meilleure que" exacte "pour l'estimation d'intervalle de proportions binomiales". Le statisticien américain 52: 119-126.
Jovanovic, BD et PS Levy, 1997. La règle de trois. Le statisticien américain Vol. 51, n ° 2, p. 137-139
Ross, TD (2003). "Intervalles de confiance précis pour l'estimation de la proportion binomiale et du taux de Poisson". Computers in Biology and Medicine 33: 509–531.
la source
Intervalle de confiance de vraisemblance maximale
L’approximation normale de l’échantillon de Bernoulli repose sur une taille d’échantillon relativement grande et des proportions d’échantillon éloignées des queues. L'estimation du maximum de vraisemblance se concentre sur les probabilités transformées en log, ce qui fournit des intervalles efficaces et non symétriques pour qu'il convient d'utiliser.p
Définissez les cotes du journal commeβ^0=log(p^/(1−p^))
Un IC 1- pour est donné par:α β0
Et ceci est transformé en un intervalle (non symétrique) pour avec:p
Cet IC présente l'avantage supplémentaire que les proportions se situent dans l'intervalle compris entre 0 et 1 et qu'il est toujours plus étroit que l'intervalle normal tout en maintenant le niveau correct. Vous pouvez l'obtenir très facilement dans R en spécifiant:
Intervalles de confiance binomiaux exacts
Dans les petits échantillons, l'approximation normale de la MLE - bien que meilleure que l'approximation normale de la proportion de l'échantillon - peut ne pas être fiable. C'est bon. peut être pris pour suivre une densité binomiale . Les limites de peuvent être trouvées en prenant les 2,5ème et 97,5ème centiles de cette distribution.Y=np^ (n,p) p^
Rarement, un intervalle de confiance binomial exact peut être obtenu manuellement pour utilisant des méthodes de calcul.p
Intervalles de confiance non biaisés médians
Et si est égal à 0 ou 1 exactement, un estimateur médian non biaisé peut être utilisé pour obtenir des estimations d'intervalle non singulier basées sur la fonction de probabilité médiane non biaisée. Vous pouvez trivialement prendre la limite inférieure du cas tout-0 comme 0 WLOG. La limite supérieure est toute proportion qui satisfait:p p1−α/2
C'est aussi une routine de calcul.
Les deux dernières méthodes sont implémentées dans le
epitools
package dans R.la source