Quelle est la meilleure technique pour calculer un intervalle de confiance d’une expérience binomiale, si votre estimation est que (ou de la même manière ) et que la taille de l’échantillon est relativement petite, par exemple ?
confidence-interval
binomial
Kasper
la source
la source
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
scipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
Réponses:
Ne pas utiliser l'approximation normale
Beaucoup a été écrit sur ce problème. Un conseil général est de ne jamais utiliser l'approximation normale (l'intervalle de confiance asymptotique / Wald), car elle a des propriétés de couverture terribles. Code R pour illustrer ceci:
Pour de petites probabilités de succès, vous pouvez demander un intervalle de confiance de 95%, mais obtenir un intervalle de confiance de 10% par exemple!
Recommandations
Alors, que devrions- nous utiliser? Je crois que les recommandations actuelles sont celles qui figurent dans le document Estimation d'intervalle pour une proportion binomiale de Brown, Cai et DasGupta dans Statistical Science 2001, vol. 16, non. 2, pages 101–133. Les auteurs ont examiné plusieurs méthodes de calcul des intervalles de confiance et sont parvenus à la conclusion suivante.
L'intervalle de Wilson est aussi parfois appelé intervalle de score , puisqu'il repose sur l'inversion d'un test de score.
Calculer les intervalles
Pour calculer ces intervalles de confiance, vous pouvez utiliser cette calculatrice en ligne ou la
binom.confint()
fonction dubinom
package dans R. Par exemple, pour 0 succès dans 25 essais, le code R serait:Voici
bayes
l'intervalle de Jeffreys. (L'argumenttype="central"
est nécessaire pour obtenir l' intervalle égal .)Notez que vous devez choisir l’une des trois méthodes à utiliser avant de calculer l’intervalle. En regardant les trois et en sélectionnant le plus court, vous aurez naturellement une probabilité de couverture trop faible.
Une réponse rapide et approximative
En guise de conclusion, si vous n’observez aucune réussite dans vos n essais et souhaitez un intervalle de confiance approximatif très rapide, vous pouvez utiliser la règle de trois . Il suffit de diviser le nombre 3 par n . Dans l'exemple ci-dessus, n est 25, la limite supérieure est donc 3/25 = 0,12 (la limite inférieure est bien sûr égale à 0).
la source
bayes
utilise l'uniforme avant (à la place de Jeffrey) lorsque les deux paramètres de forme sont 1. J'ai envoyé un courrier électronique au mainteneur du paquet binom par curiosité sur les (dés) avantages de Jeffrey par rapport à l'uniforme antérieur et il m'a dit qu'une nouvelle version utiliserait l'uniforme avant par défaut. Alors ne vous demandez pas si les résultats varient légèrement à l’avenir.binconf
méthode enHmisc
calcule également ces intervalles. La méthode de Wilson est utilisée par défaut.Agretsi (2007, p. 9-10) montre que, lorsqu'une proportion tombe près de 0 ou 1, l'intervalle de confiance fonctionne mal. Au lieu de cela, utilisez un "tests de signification de la dualité wuith ... [qui] est constitué de toutes les valeurs de pour le paramètre d'hypothèse NULL qui est jugé plausible," où est le paramètre inconnu. Pour ce faire, dans l'équation . Pour ce faire, en quadrillant les deux côtés, vous obtenez Résolvez à l’aide de la formule quadratique, qui donnera valeur z critique appropriée.p±zα/2p(1−p)/n−−−−−−−−−√ π0 π0 π0 |p−π0|p(1−p)/n−−−−−−−−−√=0 (1+z20/n)π20+(−2p−z20/n)π0+p2=0
la source