Un intervalle de confiance fournit-il réellement une mesure de l'incertitude d'une estimation de paramètre?

Je lisais un article de blog du statisticien William Briggs, et l'affirmation suivante m'a le moins intéressé.

Qu'est-ce que vous en faites?

Qu'est-ce qu'un intervalle de confiance? C'est une équation, bien sûr, qui vous fournira un intervalle pour vos données. Il vise à fournir une mesure de l'incertitude d'une estimation de paramètre. Maintenant, strictement selon la théorie fréquentiste - que nous pouvons même supposer vraie - la seule chose que vous pouvez dire au sujet de l'IC que vous avez en main est que la vraie valeur du paramètre se trouve en lui ou non. C'est une tautologie, donc c'est toujours vrai. Ainsi, l'IC ne fournit aucune mesure de l'incertitude: en fait, c'est un exercice inutile d'en calculer une.

Lien: http://wmbriggs.com/post/3169/

confidence-interval frequentist philosophical Cinq σ
la source

Sans référence précise, il n'y a, surtout, aucun contexte ici. Il n'y a également aucun moyen d'obtenir des indications sur le style et les références de William Briggs (que je ne connais pas). Il se pourrait que voici quelqu'un qui aime juste être provocateur et scandaleux. Il y a, naturellement, des questions techniques et philosophiques profondes et difficiles ici aussi, qui sont la question, mais nous demander de débattre d'une citation sans arrière-plan est (une seule vue) peu susceptible d'être fructueux.

Nick Cox

@NickCox En ce qui concerne l'omission du contexte pertinent, j'ai maintenant édité le post initial.

Five σ

Merci beaucoup d'avoir fourni la sauvegarde. Ce n'est qu'un commentaire et je n'ai pas envie de le prolonger, mais ma réaction en trois mots est que la dernière phrase est une affirmation exagérée . Vous pouvez espérer des réponses beaucoup plus complètes.

Nick Cox

@NickCox Pas de problème Nick. Cependant, j'apprécie vos sentiments car il était bâclé de ma part de ne pas faire référence à ma question.

Cinq σ

@ Nick, je dirais que Briggs a réussi l'un de ses deux objectifs: "Les pensées d'aujourd'hui ne sont qu'un croquis pour aider à éclaircir mon esprit et commencer une discussion. Ce qui signifie qu'il est probable que j'aurai été la proie de ma propre plainte" (que votre "quartier statisticien "est un" penseur bâclé ").

whuber

Réponses:

Il se réfère, plutôt maladroitement, au fait bien connu que l'analyse fréquentiste ne modélise pas l'état de nos connaissances sur un paramètre inconnu avec une distribution de probabilité, donc ayant calculé un intervalle de confiance (disons 95%) (disons 1,2 à 3,4) pour un paramètre de population (par exemple, la moyenne d'une distribution gaussienne) à partir de certaines données, vous ne pouvez pas aller de l'avant et affirmer qu'il y a une probabilité de 95% que la moyenne se situe entre 1,2 et 3,4. La probabilité est un ou zéro - vous ne savez pas laquelle. Mais ce que vous pouvez dire, en général, c'est que votre procédure de calcul des intervalles de confiance à 95% est celle qui garantit qu'ils contiennent la vraie valeur du paramètre 95% du temps. Cela semble une raison suffisante pour dire que les IC reflètent l'incertitude. Comme l'a dit Sir David Cox ^†

Nous définissons des procédures pour évaluer les preuves qui sont calibrées par la façon dont elles fonctionneraient si elles étaient utilisées à plusieurs reprises. En ce sens, ils ne diffèrent pas des autres instruments de mesure.

Voir ici et ici pour plus d'explications.

D'autres choses que vous pouvez dire varient selon la méthode particulière que vous avez utilisée pour calculer l'intervalle de confiance; si vous vous assurez que les valeurs à l'intérieur ont une plus grande probabilité, compte tenu des données, que les points à l'extérieur, alors vous pouvez dire cela (et c'est souvent approximativement vrai pour les méthodes couramment utilisées). Voir ici pour en savoir plus.

† Cox (2006), Principes d'inférence statistique , §1.5.2

Scortchi - Réintégrer Monica
la source

C'est Sir David Cox, j'imagine.

Nick Cox

@NickCox: En effet.

Scortchi - Réintégrer Monica

L'analogie citée par Sir David est-elle correcte? (Pas une citation correcte, mais une analogie correcte.) Je n'imagine pas un thermomètre qui 95% du temps rapporte la température , mais 5% du temps rapporte la température en dehors de - et peut-être bien en dehors de cette plage?

\pm ϵ

$\pm\epsilon$

\pm ϵ

$\pm\epsilon$

Wayne

@Spectrosaurus: Les articles que j'ai liés pour y entrer plus en détail. In fine, la moyenne de la population n'est pas modélisée comme une variable aléatoire; les données sont, avec une distribution qui dépend de , et l'intervalle de confiance est fonction des données. définit un intervalle de confiance valide à 95% couverture, quelle que soit la valeur . Donc, si , ...

μ

$\mu$

{\vec{X}}_{μ}

$\vec{X}_\mu$

μ

$\mu$

(b_{L} (X_{μ}), b_{U} (X_{μ}))

$(b_\mathrm{L}(X_\mu), b_\mathrm{U}(X_\mu))$

Pr [b_{U} ({\vec{X}}_{μ}) < μ < b_{U} ({\vec{X}}_{μ})] = 0.95

$\Pr[b_\mathrm{U}(\vec{X}_\mu) < \mu < b_\mathrm{U}(\vec{X}_\mu)]=0.95$

μ

$\mu$

μ = 2

$\mu=2$

Scortchi - Réintégrer Monica

... est vrai, et si , est vrai. Maintenant, la substitution dans les valeurs réalisées de donne par exemple , c'est-à-dire si , & if , - ce qui est un non-sens.

Pr [b_{U} ({\vec{X}}_{2}) < 2 < b_{U} ({\vec{X}}_{2})] = 0.95

$\Pr[b_\mathrm{U}(\vec{X}_2) < 2 < b_\mathrm{U}(\vec{X}_2)]=0.95$

μ = 7

$\mu=7$

Pr [b_{U} ({\vec{X}}_{7}) < 7 < b_{U} ({\vec{X}}_{7})] = 0.95

$\Pr[b_\mathrm{U}(\vec{X}_7) < 7 < b_\mathrm{U}(\vec{X}_7)]=0.95$

X_{μ}

$X_\mu$

Pr [1.2 < μ < 3.4] = 0.95

$\Pr[1.2 < \mu < 3.4]=0.95$

μ = 2

$\mu=2$

Pr [1.2 < 2 < 3.4] = 0.95

$\Pr[1.2 < 2 < 3.4]=0.95$

μ = 7

$\mu=7$

Pr [1.2 < 2 < 3.4] = 0.95

$\Pr[1.2 < 2 < 3.4]=0.95$

Scortchi - Réintégrer Monica

Il peut être difficile de caractériser mathématiquement l'incertitude, mais je le sais quand je le vois; il a généralement de larges intervalles de confiance à 95%.

N Brouwer
la source