Cette question est venue au travail lorsque quelqu'un m'a demandé quelle était la relation entre un centile et un intervalle de confiance, et j'ai eu beaucoup de mal à articuler mes pensées. Le contexte était une question très simple concernant l'estimation d'un intervalle de confiance à 95% sur une moyenne d'échantillon.
Je comprends que le théorème central limite indique que la distribution d'échantillonnage de la moyenne de toute variable aléatoire indépendante sera normale ou presque normale, si la taille de l'échantillon est suffisamment grande. Ainsi, la moyenne de l'échantillon a une distribution normaleoù est l'écart type de l'échantillon.
Supposons maintenant que l'hypothèse nulle soit vraie. Ensuite, sous l'hypothèse nulle, l'intervalle de confiance à 95% autour de la moyenne de l'échantillon est
La question de mon collègue était précisément la suivante: l'erreur type n'est que l'écart type de la distribution d'échantillonnage de la moyenne. Ainsi, serait être équivalent au 97,5 centile d'une distribution créée en calculant la moyenne d'échantillonnage de nombreux échantillons de taille ?
La question était vraiment étrange pour moi parce que les centiles et les intervalles de confiance sont deux concepts distincts et la question de mon collègue posait la question de la relation entre les deux, et je suis devenu très confus mais je n'ai pas pu articuler mes points.
Toute aide serait grandement appréciée!
la source
Réponses:
Votre collègue a raison, les intervalles de confiance sont basés sur les centiles de la distribution d'échantillonnage de la statistique d'intérêt. Dans ce cas, la statistique estμ^=1n∑Xje . Les centiles deX sont différents.
Vous pouvez vous essayer à réaliser votre expérience de dessiner de nombreuxμ^je et calculer leurs centiles. Vous trouverez un bon accord avec la formule de théorie normale à condition quen pour chaque μ^je est assez grand. Et si vous continuez à y penser, vous pourriez finir par réinventer le bootstrap, qui utilise les centiles observés deX pour générer de nombreux μ^je puis utilise les centiles de cet échantillon généré pour créer un intervalle de confiance.
la source