Toutes les valeurs comprises dans un intervalle de confiance de 95% sont-elles également probables?

56

J'ai trouvé des informations discordantes sur la question: " Si l'on construit un intervalle de confiance (IC) à 95% d'une différence de moyennes ou d'une différence de proportions, toutes les valeurs de l'IC sont-elles également probables? Ou bien, l'estimation ponctuelle est-elle la plus probable? , avec des valeurs proches des "queues" de l'IC moins probables que celles situées au milieu de l'IC?

Par exemple, si un rapport d'essai clinique randomisé indique que le risque relatif de mortalité avec un traitement particulier est de 1,06 (IC à 95% de 0,96 à 1,18), la probabilité que 0,96 soit la valeur correcte est-elle identique à 1,06?

J'ai trouvé de nombreuses références à ce concept en ligne, mais les deux exemples suivants reflètent l'incertitude qui y règne:

  1. Le module de Lisa Sullivan sur les intervalles de confiance indique:

    Les intervalles de confiance pour la différence de moyennes fournissent une plage de valeurs probables pour ( μ1μ2 ). Il est important de noter que toutes les valeurs de l'intervalle de confiance sont des estimations également probables de la valeur vraie de ( μ1μ2 ).

  2. Cet article de blog, intitulé Dans la marge d'erreur , déclare:

    Ce que je pense à l’esprit, c’est un malentendu quant à la «marge d’erreur» qui traite tous les points compris dans l’intervalle de confiance de la même manière, comme si le théorème de la limite centrale impliquait une distribution uniforme bornée au lieu d’une distribution t . [...]
    Ce qui parle de «marge d'erreur», c'est que les possibilités proches de l'estimation ponctuelle sont beaucoup plus probables que celles situées au bord de la marge ".

Celles-ci semblent contradictoires, alors qui est correct?

pmgjones
la source
7
Je me demande s'il y a une confusion quelque part avec le concept connexe selon lequel les valeurs p sont uniformément distribuées sous l'hypothèse nulle.
Michael McGowan
4
La première citation est un glissement aberrant dans un compte par ailleurs précis des intervalles de confiance. La deuxième citation est tirée d'un récit qui, pour le dire gentiment, est un gâchis bâclé: il est plein d'énoncés vagues, incorrects, ou ne peuvent être interprétés que dans un sens bayésien. Mais les deux citations sont fausses !
whuber
@whuber Je ne qualifierais pas le second de gâchis ... je dirais que c'est une interprétation bayésienne de l'interprétation Frequentist :)
Michael McGowan
1
@Michael Un exemple de sloppiness est un solécisme tel que l'affirmation du CLT implique qu'un "nombre infini d'estimations répétées de [la population] moyenne suivra toujours une distribution normale". Il n’est pas nécessaire de se tromper pour communiquer des idées simplement à un public non technique.
whuber
2
@ Whuber, je considère que la phrase que vous citez est un péché mineur. L'erreur principale est que CLT n'implique pas t distribution.
vitreux

Réponses:

23

Une question à laquelle il faut répondre est la suivante: que signifie "probablement" dans ce contexte?

Si cela signifie probabilité (comme il est parfois utilisé comme synonyme de) et que nous utilisons des définitions fréquentistes strictes, la valeur vraie du paramètre est une valeur unique qui ne change pas. La probabilité (probabilité) de ce point est donc égale à 100%. les autres valeurs sont 0%. Donc, presque tous sont égaux à 0%, mais si l'intervalle contient la valeur vraie, alors il est différent des autres.

Si nous utilisons une approche bayésienne, alors l'IC (intervalle crédible) provient de la distribution postérieure et vous pouvez comparer la probabilité aux différents points de l'intervalle. À moins que le postérieur ne soit parfaitement uniforme dans l'intervalle (théoriquement possible, mais ce serait une circonstance étrange), les valeurs ont des probabilités différentes.

Si vous utilisez des termes susceptibles de ressembler à la confiance, réfléchissez-y ainsi: Calculez un intervalle de confiance de 95%, un intervalle de confiance de 90% et un intervalle de confiance de 85%. Nous serions 5% sûrs que la valeur réelle se situe dans la région située à l'intérieur de l'intervalle de 95%, mais en dehors de l'intervalle de 90%, nous pourrions dire que la valeur réelle est susceptible de tomber à 5% dans cette région. Il en va de même pour la région située dans l'intervalle de 90% mais en dehors de l'intervalle de 85%. Ainsi, si toutes les valeurs ont la même probabilité, la taille des deux régions ci-dessus doit être exactement la même, et il en va de même pour la région comprise dans un intervalle de confiance de 10% mais inférieure à un intervalle de confiance de 5%. Aucune des distributions standard utilisées pour la construction des intervalles n'a cette propriété (sauf les cas spéciaux avec 1 tirage d'un uniforme).

Vous pourriez vous en convaincre davantage en simulant un grand nombre d'ensembles de données provenant de populations connues, en calculant l'intervalle de confiance considéré, puis en comparant la fréquence à laquelle le paramètre réel est plus proche de l'estimation ponctuelle que de chacun des points finaux.

Greg Snow
la source
3
La vraisemblance est ce dont cette question a besoin dans la réponse, et non la probabilité, qu'elle soit fréquente ou bayésienne. La vraisemblance fournit exactement la réponse, les autres ne peuvent le faire qu'avec des torsions et des étirements.
Michael Lew
1
@ Greg J'aime votre explication. Juste pour clarifier les choses, votre argument soutient la notion selon laquelle les valeurs aux "queues" de l'IC à 95% sont moins probables (moins probables) que celles plus proches de l'estimation ponctuelle, n'est-ce pas? Merci pour votre réponse.
pmgjones
1
@pmgjones moins probable, NON, voir 2e paragraphe. Moins probable dans le contexte du 4ème paragraphe, oui.
Greg Snow
2
@GregSnow Votre deuxième paragraphe indique presque exactement que la probabilité que le paramètre vrai soit le paramètre véritable est de 100%. Croyez-vous vraiment que cette tautologie est ce que les "définitions fréquentistes strictes" ont à offrir?
rolando2
2
@ rolando2, je pense que les statistiques fréquentistes ont beaucoup à offrir, j’éliminais simplement les inexactitudes courantes qui impliquent de véritables changements de valeur et se situent parfois en dehors de l’intervalle et parfois dans l’intervalle (et parfois plus près des limites et parfois plus près du centre). Les derniers paragraphes décrivent ensuite plus fidèlement les idées.
Greg Snow
19

C'est une excellente question! Il existe un concept mathématique appelé probabilité qui vous aidera à comprendre les problèmes. Fisher a inventé la probabilité mais la considérait un peu moins souhaitable que la probabilité, mais la probabilité s’avère être plus «primitive» que la probabilité et Ian Hacking (1965) l’a considérée comme axiomatique car elle n’est pas prouvable. La probabilité sous-tend la probabilité plutôt que l'inverse.

Piratage, 1965. Logic of Statistical Inference .

La probabilité n’est pas accordée à l’attention qu’elle devrait avoir dans les manuels classiques de statistiques, sans raison valable. Elle diffère de la probabilité par le fait qu'elle possède presque exactement les propriétés attendues et que les fonctions et les intervalles de vraisemblance sont très utiles pour l'inférence. Certains statisticiens n’apprécient peut-être pas la probabilité, car il n’existe parfois aucun moyen «approprié» d’en déduire les fonctions de probabilité pertinentes. Cependant, dans de nombreux cas, les fonctions de vraisemblance sont évidentes et bien définies. Une étude des probabilités d'inférence devrait probablement commencer par le petit livre de Richard Royall, facile à comprendre, intitulé Preuve statistique: un paradigme de vraisemblance .

La réponse à votre question est que non, les points dans un intervalle n'ont pas tous la même probabilité. Ceux qui se trouvent aux limites d'un intervalle de confiance ont généralement une probabilité plus faible que les autres vers le centre de l'intervalle. Bien entendu, l'intervalle de confiance conventionnel ne vous dit rien directement sur le paramètre pertinent pour l'expérience. Les intervalles de confiance de Neyman sont «globaux» en ce sens qu'ils sont conçus pour avoir des propriétés à long terme plutôt que des propriétés «locales» pertinentes pour l'expérience en cours. (Heureusement, une bonne performance à long terme peut être interprétée localement, mais il s'agit d'un raccourci intellectuel plutôt que d'une réalité mathématique.) Les intervalles de probabilité - dans les cas où ils peuvent être construits - reflètent directement la probabilité reliant l'expérience en question.

Michael Lew
la source
1
@suncoolsu Il n'est pas nécessaire que l'intervalle en question soit un intervalle de probabilité pour que l'instruction soit vraie. L'intervalle ne doit couvrir que l'estimation la plus probable, de sorte que les limites de l'intervalle sont moins probables qu'un point de l'intervalle. Tout intervalle de confiance ordinaire satisfera à cette exigence.
Michael Lew
2
@pmjones Un IC à 95% NE DOIT PAS vous dire si les valeurs vers les marges de l'IC sont plus proches de la vérité que les valeurs du milieu. Les IC font des déclarations sur l'échantillonnage répété de la population. À long terme (après des échantillonnages répétés), 95% de ces CI, construits pour chaque échantillon, couvriront la valeur réelle. Par conséquent, il y a deux observations clés: 1) On ne peut rien dire sur la valeur réelle pour un CI donné. 2) Les CI ne vous disent rien sur les données observées, ce qui est une critique bayésienne habituelle.
suncoolsu
1
@MichaelLew Le principe de vraisemblance est utile, mais je disais (en citant LW) "En effet, toute inférence fréquentiste viole LP, donc si nous adhérions à LP, nous devions abandonner l'inférence fréquentiste." Parce que CI est une idée fréquentiste, cela viole LP (que vous dites fondamental).
suncoolsu
1
@suncollsu La question n'est pas de savoir si un intervalle de confiance, seul et sans autre considération statistique, ne dit rien sur la vraisemblance des valeurs de paramètre en lui-même. Il s'agit de la probabilité de valeurs de paramètres dans l'intervalle. La fonction de vraisemblance répond à la question et cette réponse est correcte même si l'intervalle de confiance enfreint le principe de vraisemblance. (Lisez à nouveau mon commentaire précédent. Vous semblez avoir totalement ignoré son contenu.)
Michael Lew
2
@ rolando2 Les intervalles de confiance à 95% de Neyman sont conçus de manière à ce que la méthode contienne le paramètre true à 95% de son utilisation. Strictement parlant, la confiance est attachée à la méthode et non à un intervalle individuel, de sorte que cet intervalle individuel ne vous dit rien sur l'état du monde dans cette expérience particulière. Voir ma réponse à cette question pour plus de détails: stats.stackexchange.com/questions/8844/…
Michael Lew
18

Supposons que quelqu'un me dise que je devrais placer une confiance égale dans toutes les valeurs d'une CI95 en tant qu'indicateur potentiel de la valeur de la population. (J'évite délibérément les termes "probable" et "probable".) Quelle est la particularité de 95? Rien: pour être cohérent, je devrais également accorder une confiance égale à toutes les valeurs d'un CI96, d'un CI97, ... et d'un CI99.9999999. La couverture de l'IC s'approchant de sa limite, il faudrait pratiquement inclure tous les nombres réels. Le ridicule de cette conclusion m'amènerait à rejeter la demande initiale.

rolando2
la source
4
C'est une excellente réponse! J'aurais dû penser à l'effet d'approcher les extrêmes d'IC ​​possibles. Merci d'avoir écrit ça!
pmgjones
2

Commençons par la définition d'un intervalle de confiance. Si je dis qu'un intervalle de confiance de 95% va de ceci à cela, je veux dire que des déclarations de cette nature seront vraies environ 95% du temps et fausses environ 5% du temps. Je ne veux pas nécessairement dire que je suis à 95% confiant quant à cette affirmation. Un intervalle de confiance de 90% sera plus étroit et un intervalle de 80% encore plus étroit. Par conséquent, lorsque je me demande quelle est la vraie valeur, j’ai moins de crédibilité dans les valeurs à mesure qu’elles se rapprochent de la limite d’un intervalle de confiance particulier.

Notez que tout ce qui précède est qualitatif, en particulier "crédence". (J'ai évité les termes "confiance" ou "vraisemblance" dans cette affirmation car ils contiennent un bagage mathématique qui peut différer de notre bagage intuitif.) Les approches bayésiennes reformuleraient votre question en une réponse quantitative, mais je ne veux pas ouvrir. cette boîte de Pandore ici.

Le texte classique de Box, Hunter & Hunter ("Statistics for Experimenters", Wiley, 1978) peut également aider. Voir "Ensembles d'intervalles de confiance", pages 113 et suivantes.

Emil Friedman
la source
Étant donné que nous traitons en partie de concepts et en partie de sémantique, je soulignerai que dans votre deuxième phrase, vous avez dit "... les déclarations de cette nature seront vraies ..." sans préciser quelles déclarations seraient vraies.
rolando2