Lorsque vous dites que vous êtes habitué aux intervalles de confiance contenant une expression de variance, vous pensez au cas gaussien, dans lequel les informations sur les deux paramètres caractérisant la population - l'une sa moyenne et l'autre sa variance - sont résumées par l'échantillon variance moyenne et échantillon. La moyenne de l'échantillon estime la moyenne de la population, mais la précision avec laquelle elle le fait dépend de la variance de la population, estimée à son tour par la variance de l'échantillon. La distribution binomiale, en revanche, n'a qu'un seul paramètre - la probabilité de réussite de chaque essai individuel - et toutes les informations fournies par l'échantillon sur ce paramètre sont résumées dans le nombre total. succès de tant d’essais indépendants. La variance et la moyenne de la population sont toutes deux déterminées par ce paramètre.
Vous pouvez obtenir un intervalle de confiance Clopper – Pearson à 95% (par exemple) pour le paramètre travaillant directement avec la fonction de masse de probabilité binomiale. Supposons que vous observiez succès sur essais. Le pmf estx nπxn
Pr(X=x)=(nx)πx(1−π)n−x
Augmentez jusqu'à ce que la probabilité de succès de ou moins tombe à 2,5%: c'est votre limite supérieure. Diminuez jusqu'à ce que la probabilité de succès de ou plus tombe à 2,5%: c'est votre limite inférieure. (Je vous suggère d'essayer de le faire si ce n'est pas clair à la lecture de ce sujet.) Ce que vous faites ici, c'est de trouver les valeurs de qui, prises comme une hypothèse nulle, entraîneraient son rejet (seulement juste) par un test bilatéral à un niveau de signification de 5%. À long terme, les bornes calculées de cette façon couvrent la vraie valeur de , quelle qu'elle soit, au moins 95% du temps.πxπxππ