Je lisais un article de blog du statisticien William Briggs, et l'affirmation suivante m'a le moins intéressé.
Qu'est-ce que vous en faites?
Qu'est-ce qu'un intervalle de confiance? C'est une équation, bien sûr, qui vous fournira un intervalle pour vos données. Il vise à fournir une mesure de l'incertitude d'une estimation de paramètre. Maintenant, strictement selon la théorie fréquentiste - que nous pouvons même supposer vraie - la seule chose que vous pouvez dire au sujet de l'IC que vous avez en main est que la vraie valeur du paramètre se trouve en lui ou non. C'est une tautologie, donc c'est toujours vrai. Ainsi, l'IC ne fournit aucune mesure de l'incertitude: en fait, c'est un exercice inutile d'en calculer une.
Réponses:
Il se réfère, plutôt maladroitement, au fait bien connu que l'analyse fréquentiste ne modélise pas l'état de nos connaissances sur un paramètre inconnu avec une distribution de probabilité, donc ayant calculé un intervalle de confiance (disons 95%) (disons 1,2 à 3,4) pour un paramètre de population (par exemple, la moyenne d'une distribution gaussienne) à partir de certaines données, vous ne pouvez pas aller de l'avant et affirmer qu'il y a une probabilité de 95% que la moyenne se situe entre 1,2 et 3,4. La probabilité est un ou zéro - vous ne savez pas laquelle. Mais ce que vous pouvez dire, en général, c'est que votre procédure de calcul des intervalles de confiance à 95% est celle qui garantit qu'ils contiennent la vraie valeur du paramètre 95% du temps. Cela semble une raison suffisante pour dire que les IC reflètent l'incertitude. Comme l'a dit Sir David Cox †
Voir ici et ici pour plus d'explications.
D'autres choses que vous pouvez dire varient selon la méthode particulière que vous avez utilisée pour calculer l'intervalle de confiance; si vous vous assurez que les valeurs à l'intérieur ont une plus grande probabilité, compte tenu des données, que les points à l'extérieur, alors vous pouvez dire cela (et c'est souvent approximativement vrai pour les méthodes couramment utilisées). Voir ici pour en savoir plus.
† Cox (2006), Principes d'inférence statistique , §1.5.2
la source
Il peut être difficile de caractériser mathématiquement l'incertitude, mais je le sais quand je le vois; il a généralement de larges intervalles de confiance à 95%.
la source