J'ai trouvé des informations discordantes sur la question: " Si l'on construit un intervalle de confiance (IC) à 95% d'une différence de moyennes ou d'une différence de proportions, toutes les valeurs de l'IC sont-elles également probables? Ou bien, l'estimation ponctuelle est-elle la plus probable? , avec des valeurs proches des "queues" de l'IC moins probables que celles situées au milieu de l'IC?
Par exemple, si un rapport d'essai clinique randomisé indique que le risque relatif de mortalité avec un traitement particulier est de 1,06 (IC à 95% de 0,96 à 1,18), la probabilité que 0,96 soit la valeur correcte est-elle identique à 1,06?
J'ai trouvé de nombreuses références à ce concept en ligne, mais les deux exemples suivants reflètent l'incertitude qui y règne:
Le module de Lisa Sullivan sur les intervalles de confiance indique:
Les intervalles de confiance pour la différence de moyennes fournissent une plage de valeurs probables pour ( ). Il est important de noter que toutes les valeurs de l'intervalle de confiance sont des estimations également probables de la valeur vraie de ( ).
Cet article de blog, intitulé Dans la marge d'erreur , déclare:
Ce que je pense à l’esprit, c’est un malentendu quant à la «marge d’erreur» qui traite tous les points compris dans l’intervalle de confiance de la même manière, comme si le théorème de la limite centrale impliquait une distribution uniforme bornée au lieu d’une distribution t . [...]
Ce qui parle de «marge d'erreur», c'est que les possibilités proches de l'estimation ponctuelle sont beaucoup plus probables que celles situées au bord de la marge ".
Celles-ci semblent contradictoires, alors qui est correct?
la source
Réponses:
Une question à laquelle il faut répondre est la suivante: que signifie "probablement" dans ce contexte?
Si cela signifie probabilité (comme il est parfois utilisé comme synonyme de) et que nous utilisons des définitions fréquentistes strictes, la valeur vraie du paramètre est une valeur unique qui ne change pas. La probabilité (probabilité) de ce point est donc égale à 100%. les autres valeurs sont 0%. Donc, presque tous sont égaux à 0%, mais si l'intervalle contient la valeur vraie, alors il est différent des autres.
Si nous utilisons une approche bayésienne, alors l'IC (intervalle crédible) provient de la distribution postérieure et vous pouvez comparer la probabilité aux différents points de l'intervalle. À moins que le postérieur ne soit parfaitement uniforme dans l'intervalle (théoriquement possible, mais ce serait une circonstance étrange), les valeurs ont des probabilités différentes.
Si vous utilisez des termes susceptibles de ressembler à la confiance, réfléchissez-y ainsi: Calculez un intervalle de confiance de 95%, un intervalle de confiance de 90% et un intervalle de confiance de 85%. Nous serions 5% sûrs que la valeur réelle se situe dans la région située à l'intérieur de l'intervalle de 95%, mais en dehors de l'intervalle de 90%, nous pourrions dire que la valeur réelle est susceptible de tomber à 5% dans cette région. Il en va de même pour la région située dans l'intervalle de 90% mais en dehors de l'intervalle de 85%. Ainsi, si toutes les valeurs ont la même probabilité, la taille des deux régions ci-dessus doit être exactement la même, et il en va de même pour la région comprise dans un intervalle de confiance de 10% mais inférieure à un intervalle de confiance de 5%. Aucune des distributions standard utilisées pour la construction des intervalles n'a cette propriété (sauf les cas spéciaux avec 1 tirage d'un uniforme).
Vous pourriez vous en convaincre davantage en simulant un grand nombre d'ensembles de données provenant de populations connues, en calculant l'intervalle de confiance considéré, puis en comparant la fréquence à laquelle le paramètre réel est plus proche de l'estimation ponctuelle que de chacun des points finaux.
la source
C'est une excellente question! Il existe un concept mathématique appelé probabilité qui vous aidera à comprendre les problèmes. Fisher a inventé la probabilité mais la considérait un peu moins souhaitable que la probabilité, mais la probabilité s’avère être plus «primitive» que la probabilité et Ian Hacking (1965) l’a considérée comme axiomatique car elle n’est pas prouvable. La probabilité sous-tend la probabilité plutôt que l'inverse.
Piratage, 1965. Logic of Statistical Inference .
La probabilité n’est pas accordée à l’attention qu’elle devrait avoir dans les manuels classiques de statistiques, sans raison valable. Elle diffère de la probabilité par le fait qu'elle possède presque exactement les propriétés attendues et que les fonctions et les intervalles de vraisemblance sont très utiles pour l'inférence. Certains statisticiens n’apprécient peut-être pas la probabilité, car il n’existe parfois aucun moyen «approprié» d’en déduire les fonctions de probabilité pertinentes. Cependant, dans de nombreux cas, les fonctions de vraisemblance sont évidentes et bien définies. Une étude des probabilités d'inférence devrait probablement commencer par le petit livre de Richard Royall, facile à comprendre, intitulé Preuve statistique: un paradigme de vraisemblance .
La réponse à votre question est que non, les points dans un intervalle n'ont pas tous la même probabilité. Ceux qui se trouvent aux limites d'un intervalle de confiance ont généralement une probabilité plus faible que les autres vers le centre de l'intervalle. Bien entendu, l'intervalle de confiance conventionnel ne vous dit rien directement sur le paramètre pertinent pour l'expérience. Les intervalles de confiance de Neyman sont «globaux» en ce sens qu'ils sont conçus pour avoir des propriétés à long terme plutôt que des propriétés «locales» pertinentes pour l'expérience en cours. (Heureusement, une bonne performance à long terme peut être interprétée localement, mais il s'agit d'un raccourci intellectuel plutôt que d'une réalité mathématique.) Les intervalles de probabilité - dans les cas où ils peuvent être construits - reflètent directement la probabilité reliant l'expérience en question.
la source
Supposons que quelqu'un me dise que je devrais placer une confiance égale dans toutes les valeurs d'une CI95 en tant qu'indicateur potentiel de la valeur de la population. (J'évite délibérément les termes "probable" et "probable".) Quelle est la particularité de 95? Rien: pour être cohérent, je devrais également accorder une confiance égale à toutes les valeurs d'un CI96, d'un CI97, ... et d'un CI99.9999999. La couverture de l'IC s'approchant de sa limite, il faudrait pratiquement inclure tous les nombres réels. Le ridicule de cette conclusion m'amènerait à rejeter la demande initiale.
la source
Commençons par la définition d'un intervalle de confiance. Si je dis qu'un intervalle de confiance de 95% va de ceci à cela, je veux dire que des déclarations de cette nature seront vraies environ 95% du temps et fausses environ 5% du temps. Je ne veux pas nécessairement dire que je suis à 95% confiant quant à cette affirmation. Un intervalle de confiance de 90% sera plus étroit et un intervalle de 80% encore plus étroit. Par conséquent, lorsque je me demande quelle est la vraie valeur, j’ai moins de crédibilité dans les valeurs à mesure qu’elles se rapprochent de la limite d’un intervalle de confiance particulier.
Notez que tout ce qui précède est qualitatif, en particulier "crédence". (J'ai évité les termes "confiance" ou "vraisemblance" dans cette affirmation car ils contiennent un bagage mathématique qui peut différer de notre bagage intuitif.) Les approches bayésiennes reformuleraient votre question en une réponse quantitative, mais je ne veux pas ouvrir. cette boîte de Pandore ici.
Le texte classique de Box, Hunter & Hunter ("Statistics for Experimenters", Wiley, 1978) peut également aider. Voir "Ensembles d'intervalles de confiance", pages 113 et suivantes.
la source