Interprétation de l'intervalle de confiance

16

Remarque: excuses à l'avance s'il s'agit d'un doublon, je n'ai pas trouvé de q similaire dans ma recherche

Disons que nous avons un vrai paramètre p. Un intervalle de confiance C (X) est un RV qui contient p, disons 95% du temps. Supposons maintenant que nous observons X et calculons C (X). La réponse commune semble être qu'il est incorrect d'interpréter cela comme ayant "95% de chances de contenir p" car il "contient ou ne contient pas p"

Cependant, disons que je prends une carte du haut d'un paquet mélangé et la laisse face cachée. Intuitivement, je pense à la probabilité que cette carte soit l'As de pique à 1/52, même si en réalité "c'est ou non l'As de pique". Pourquoi ne puis-je pas appliquer ce raisonnement à l'exemple de l'intervalle de confiance?

Ou s'il n'est pas significatif de parler de la "probabilité" que la carte soit l'as de pique puisqu'elle "est ou non", je dirais quand même que ce n'est pas l'as de pique. Y a-t-il un autre mot pour décrire cette information? En quoi ce concept est-il différent de la «probabilité»?

edit: Peut-être pour être plus clair, à partir d'une interprétation bayésienne de la probabilité, si on me dit qu'une variable aléatoire contient p 95% du temps, étant donné la réalisation de cette variable aléatoire (et aucune autre information à conditionner) correct de dire que la variable aléatoire a une probabilité de 95% de contenir p?

edit: aussi, à partir d'une interprétation fréquentiste de la probabilité, disons que le fréquentateur accepte de ne rien dire comme "il y a une probabilité de 95% que l'intervalle de confiance contienne p". Est-il toujours logique pour un fréquentiste d'avoir une "confiance" que l'intervalle de confiance contient p?

Soit alpha le niveau de signification et soit t = 100-alpha. K (t) soit la «confiance» du fréquentiste que l'intervalle de confiance contient p. Il est logique que K (t) augmente en t. Lorsque t = 100%, le fréquentiste devrait avoir la certitude (par définition) que l'intervalle de confiance contient p, afin que nous puissions normaliser K (1) = 1. De même, K (0) = 0. Vraisemblablement, K (0,95) se situe quelque part entre 0 et 1 et K (0,999999) est supérieur. En quoi le fréquentiste considérerait-il K différent de P (la distribution de probabilité)?

applicative_x
la source
1
En effet, considérons un lancer de pièce où la pièce roule sous une table, hors de vue et nous considérons l'événement où la pièce a atterri sur les têtes. À première vue, cela semble être très similaire au problème de CI - il est clair que l'événement s'est produit ou non. Pourtant, dans le cas du retournement de pièces de monnaie, de nombreux (peut-être même la plupart) des habitués semblent parfaitement heureux d'attribuer une probabilité théorique, ( . paramètre. Il me semble qu'il y a une incohérence. p
Glen_b -Reinstate Monica
@Glen_b Les fréquents dans le scénario des pièces non observées et abandonnées appliquent un raisonnement contrefactuel pour dire, non pas que la valeur nominale réelle de la pièce est "aléatoire" (bien qu'elle ne soit pas observée), mais que nous pouvons généraliser tout résultat observé à d'autres résultats potentiels dans cette baisse. monnayer et calculer les probabilités. En ce qui concerne la probabilité de la valeur nominale réelle de la pièce, qu'il s'agisse ou non de têtes, il n'y a aucune probabilité. Le est enregistré pour la construction contrefactuelle de ce paramètre. p
AdamO
@Glen_b: Je suis d'accord, voir ma question ici: stats.stackexchange.com/questions/233588/…
vonjd
@vonjd dans quelle mesure votre question n'est-elle pas simplement un double du premier paragraphe après l'ouverture "Note:" ici?
Glen_b -Reinstate Monica
@Glen_b: Pour être honnête, je n'étais pas au courant de cette question lorsque j'ai posté la mienne et elles se chevauchent certainement. Pourtant, je pense qu'ils ne sont pas des doublons car le mien est plus généralement concerné par l'utilisation de probabilités pour des résultats cachés (ce qui aurait des conséquences sur les intervalles de confiance) alors que celui-ci vise purement les intervalles de confiance. Mais si vous pensez que le mien est un doublon, n'hésitez pas à le fermer.
vonjd

Réponses:

8

Je pense que de nombreux témoignages conventionnels sur cette question ne sont pas clairs.

Disons que vous prenez un échantillon de taille et obtenez un intervalle de confiance de 95 % pour p .10095%p

Ensuite, vous prenez un autre échantillon de , indépendant du premier, et obtenez un autre intervalle de confiance à 95 % pour p .10095%p

Ce qui change, c'est l'intervalle de confiance; ce qui ne change pas, c'est . p Cela signifie que dans les méthodes fréquentistes, on dit que l'intervalle de confiance est "aléatoire" mais est "fixe" ou "constant", c'est-à-dire non aléatoire. Dans les méthodes fréquentistes, comme la méthode des intervalles de confiance, on n'attribue des probabilités qu'aux choses aléatoires.p

Donc et ( L , U ) est un intervalle de confiance. ( L = "inférieur" et U = "supérieur".) Prenez un nouvel échantillon et L et U changent mais pas p .Pr(L<p<U)=0.95(L,U)L=U=LUp

Disons que dans un cas particulier , vous avez et U = 43,61 . Dans les méthodes fréquentistes, on n'attribuerait pas de probabilité à l'énoncé 40,53 < p < 43,61 , autre qu'une probabilité de 0 ou 1 , car rien ici n'est aléatoire: 40,53 n'est pas aléatoire, p n'est pas aléatoire (car il ne changera pas si nous prenons un nouvel échantillon), et 43,61 n'est pas aléatoire.L=40.53U=43.6140.53<p<43.610140.53p43.61

En pratique, les gens se comportent comme s'ils étaient sûrs à que p est compris entre 40,53 et 43,61 . Et en pratique, cela peut souvent avoir du sens. Mais parfois non. Un tel cas est celui où des nombres aussi grands que 40 ou plus sont connus à l'avance comme improbables, ou s'ils sont connus pour être hautement probables. Si l'on peut attribuer une distribution de probabilité antérieure à p , on utilise le théorème de Bayes pour obtenir un intervalle crédible, qui peut différer de l'intervalle de confiance en raison de la connaissance préalable des plages de valeurs de p95%p40.5343.6140ppsont probables ou improbables. Il peut également arriver que les effectivement données elles - mêmes --- les choses qui changent si un nouvel échantillon est prélevé, peut vous dire que est peu susceptible d'être, ou même certains de ne pas être aussi grand que 40 . Cela peut se produire même dans les cas où la paire ( L , U ) est une statistique suffisante pour p . Ce phénomène peut être traité dans certains cas par la méthode de conditionnement de Fisher sur une statistique auxiliaire. Un exemple de ce dernier phénomène est lorsque l'échantillon est constitué de seulement deux observations indépendantes qui sont réparties uniformément dans l'intervalle & thetav ± 1 / 2p40(L,U)pθ±1/2. L'intervalle entre la plus petite des deux observations et la plus grande est alors un intervalle de confiance de . Mais si la distance entre eux est de 0,001 , il serait absurde d'être quelque part près de 50 % sûr que θ est entre eux, et si la distance est de 0,999 , on serait raisonnablement presque sûr à 100 % que θ est entre eux. La distance entre eux serait la statistique auxiliaire à laquelle on conditionnerait.50%0.00150%θ0.999100%θ

Michael Hardy
la source
Merci Michael, cela a beaucoup de sens. Supposons dans votre exemple que nous avons un particulier (L, U) mais que les valeurs ne nous sont pas connues. Tout ce que nous savons, c'est que c'est la réalisation d'une variable aléatoire à 95% d'intervalle de confiance. Sans aucun préalable sur le paramètre ou toute autre information, serait-il juste de fixer des cotes 19: 1 que (L, U) contient le paramètre? Si un fréquentateur est disposé à le faire, mais qu'il n'appelle pas sa "volonté de pondre 19: 1, qu'il contient le paramètre" une "probabilité", comment l'appellerions-nous?
applicative_x
Oui, cette probabilité est de . Certes, dans les méthodes fréquentistes, on peut dire que dans un état d'ignorance de ( L , U ), la probabilité est de 0,95 que cet intervalle contienne p . Mais quand on a des valeurs particulières, qui ne sont pas aléatoires, le fréquentateur n'attribuera pas une probabilité autre que 0 ou 1 à l'énoncé, puisque les valeurs connues de L et U ne sont pas aléatoires. 0.95(L,U)0.95p01LU
Michael Hardy
4

La définition classique d'un intervalle de confiance de % est la suivante:100×(1α)

Un intervalle qui, dans de nombreuses réplications indépendantes de l'étude dans des conditions idéales, capture la mesure de l'effet répliqué % du temps.100×(1α)

La probabilité, pour les habitués, vient de la notion de «rembobinage du temps et de l'espace» pour reproduire les découvertes, comme si un nombre infini d'exemplaires du monde étaient créés pour évaluer encore et encore et encore une découverte scientifique. Donc, une probabilité est une fréquence exactement. Pour les scientifiques, c'est une façon très pratique de discuter des résultats, car le premier principe de la science est que les études doivent être reproductibles.

Dans votre exemple de carte, la confusion pour les Bayésiens et les Frequentistes est que le Frequentiste n'attribue pas de probabilité à la valeur nominale de la carte particulière que vous avez retournée du deck alors qu'un Bayesien le ferait. Le fréquentiste attribuerait la probabilité à une carte, retournée du haut du jeu mélangé au hasard. Un bayésien n'est pas concerné par la réplication de l'étude, une fois la carte retournée, vous avez maintenant 100% de conviction sur ce qu'est la carte et 0% de conviction qu'elle pourrait prendre toute autre valeur. Pour les Bayésiens, la probabilité est une mesure de croyance.

Notez que les Bayésiens n'ont pas d' intervalles de confiance pour cette raison, ils résument l'incertitude avec des intervalles de crédibilité .

AdamO
la source
Merci pour la réponse. Dans l'exemple de la carte, le bayésien et le fréquentiste ne seraient-ils pas d'accord pour dire que 51: 1 est une bonne chance que la carte soit l'as de pique? De même, pour la réalisation d'un intervalle de confiance à 95% (et aucune autre information), les deux n'auraient-ils pas toutes les deux une chance de 19: 1 qu'il contienne le vrai paramètre? En ce sens, un bayésien pourrait-il interpréter l'intervalle de confiance à 95% comme ayant 95% de chances de contenir le vrai paramètre?
applicative_x
p=1/52
Merci Adam, je pense que je suis toujours confus. Supposons que je sache (en regardant les cartes) qu'un jeu de 52 cartes est standard. Je mélange le jeu et sélectionne les 10 meilleures cartes sans les regarder. Ne pourrais-je pas définir le "vrai paramètre" dans ce cas comme étant le nombre de cartons rouges? Quel que soit le bayésien et le fréquentiste, il existe un «vrai paramètre». Si je suis autorisé à choisir 7 cartes au hasard, je pourrais aussi imaginer construire un intervalle de confiance pour le nombre de cartons rouges sur mes 10.
applicative_x
1
1/2
1
@AdamO: Je trouve vos commentaires énigmatiques. «de quelle utilité est la notion de« vérité »» est un changement de sujet. "Nous pensons que la vérité est immuable." Donc "nous" signifie vous et qui d'autre, et quelle est la pertinence de ce qu'ils pensent? "Aucun scientifique ne se lancerait dans la collecte de données pour vérifier quelque chose qui est déjà connu." Cela semble être un autre changement de sujet. Viennent ensuite quelques commentaires sur les fréquentistes et les bayésiens. Je n'ai pas envie de deviner ce que vous essayez de dire.
Michael Hardy