Remarque: excuses à l'avance s'il s'agit d'un doublon, je n'ai pas trouvé de q similaire dans ma recherche
Disons que nous avons un vrai paramètre p. Un intervalle de confiance C (X) est un RV qui contient p, disons 95% du temps. Supposons maintenant que nous observons X et calculons C (X). La réponse commune semble être qu'il est incorrect d'interpréter cela comme ayant "95% de chances de contenir p" car il "contient ou ne contient pas p"
Cependant, disons que je prends une carte du haut d'un paquet mélangé et la laisse face cachée. Intuitivement, je pense à la probabilité que cette carte soit l'As de pique à 1/52, même si en réalité "c'est ou non l'As de pique". Pourquoi ne puis-je pas appliquer ce raisonnement à l'exemple de l'intervalle de confiance?
Ou s'il n'est pas significatif de parler de la "probabilité" que la carte soit l'as de pique puisqu'elle "est ou non", je dirais quand même que ce n'est pas l'as de pique. Y a-t-il un autre mot pour décrire cette information? En quoi ce concept est-il différent de la «probabilité»?
edit: Peut-être pour être plus clair, à partir d'une interprétation bayésienne de la probabilité, si on me dit qu'une variable aléatoire contient p 95% du temps, étant donné la réalisation de cette variable aléatoire (et aucune autre information à conditionner) correct de dire que la variable aléatoire a une probabilité de 95% de contenir p?
edit: aussi, à partir d'une interprétation fréquentiste de la probabilité, disons que le fréquentateur accepte de ne rien dire comme "il y a une probabilité de 95% que l'intervalle de confiance contienne p". Est-il toujours logique pour un fréquentiste d'avoir une "confiance" que l'intervalle de confiance contient p?
Soit alpha le niveau de signification et soit t = 100-alpha. K (t) soit la «confiance» du fréquentiste que l'intervalle de confiance contient p. Il est logique que K (t) augmente en t. Lorsque t = 100%, le fréquentiste devrait avoir la certitude (par définition) que l'intervalle de confiance contient p, afin que nous puissions normaliser K (1) = 1. De même, K (0) = 0. Vraisemblablement, K (0,95) se situe quelque part entre 0 et 1 et K (0,999999) est supérieur. En quoi le fréquentiste considérerait-il K différent de P (la distribution de probabilité)?
la source
Réponses:
Je pense que de nombreux témoignages conventionnels sur cette question ne sont pas clairs.
Disons que vous prenez un échantillon de taille et obtenez un intervalle de confiance de 95 % pour p .100 95% p
Ensuite, vous prenez un autre échantillon de , indépendant du premier, et obtenez un autre intervalle de confiance à 95 % pour p .100 95% p
Ce qui change, c'est l'intervalle de confiance; ce qui ne change pas, c'est .p Cela signifie que dans les méthodes fréquentistes, on dit que l'intervalle de confiance est "aléatoire" mais est "fixe" ou "constant", c'est-à-dire non aléatoire. Dans les méthodes fréquentistes, comme la méthode des intervalles de confiance, on n'attribue des probabilités qu'aux choses aléatoires.p
Donc et ( L , U ) est un intervalle de confiance. ( L = "inférieur" et U = "supérieur".) Prenez un nouvel échantillon et L et U changent mais pas p .Pr(L<p<U)=0.95 (L,U) L= U= L U p
Disons que dans un cas particulier , vous avez et U = 43,61 . Dans les méthodes fréquentistes, on n'attribuerait pas de probabilité à l'énoncé 40,53 < p < 43,61 , autre qu'une probabilité de 0 ou 1 , car rien ici n'est aléatoire: 40,53 n'est pas aléatoire, p n'est pas aléatoire (car il ne changera pas si nous prenons un nouvel échantillon), et 43,61 n'est pas aléatoire.L=40.53 U=43.61 40.53<p<43.61 0 1 40.53 p 43.61
En pratique, les gens se comportent comme s'ils étaient sûrs à que p est compris entre 40,53 et 43,61 . Et en pratique, cela peut souvent avoir du sens. Mais parfois non. Un tel cas est celui où des nombres aussi grands que 40 ou plus sont connus à l'avance comme improbables, ou s'ils sont connus pour être hautement probables. Si l'on peut attribuer une distribution de probabilité antérieure à p , on utilise le théorème de Bayes pour obtenir un intervalle crédible, qui peut différer de l'intervalle de confiance en raison de la connaissance préalable des plages de valeurs de p95% p 40.53 43.61 40 p p sont probables ou improbables. Il peut également arriver que les effectivement données elles - mêmes --- les choses qui changent si un nouvel échantillon est prélevé, peut vous dire que est peu susceptible d'être, ou même certains de ne pas être aussi grand que 40 . Cela peut se produire même dans les cas où la paire ( L , U ) est une statistique suffisante pour p . Ce phénomène peut être traité dans certains cas par la méthode de conditionnement de Fisher sur une statistique auxiliaire. Un exemple de ce dernier phénomène est lorsque l'échantillon est constitué de seulement deux observations indépendantes qui sont réparties uniformément dans l'intervalle & thetav ± 1 / 2p 40 (L,U) p θ±1/2 . L'intervalle entre la plus petite des deux observations et la plus grande est alors un intervalle de confiance de . Mais si la distance entre eux est de 0,001 , il serait absurde d'être quelque part près de 50 % sûr que θ est entre eux, et si la distance est de 0,999 , on serait raisonnablement presque sûr à 100 % que θ est entre eux. La distance entre eux serait la statistique auxiliaire à laquelle on conditionnerait.50% 0.001 50% θ 0.999 100% θ
la source
La définition classique d'un intervalle de confiance de % est la suivante:100×(1−α)
La probabilité, pour les habitués, vient de la notion de «rembobinage du temps et de l'espace» pour reproduire les découvertes, comme si un nombre infini d'exemplaires du monde étaient créés pour évaluer encore et encore et encore une découverte scientifique. Donc, une probabilité est une fréquence exactement. Pour les scientifiques, c'est une façon très pratique de discuter des résultats, car le premier principe de la science est que les études doivent être reproductibles.
Dans votre exemple de carte, la confusion pour les Bayésiens et les Frequentistes est que le Frequentiste n'attribue pas de probabilité à la valeur nominale de la carte particulière que vous avez retournée du deck alors qu'un Bayesien le ferait. Le fréquentiste attribuerait la probabilité à une carte, retournée du haut du jeu mélangé au hasard. Un bayésien n'est pas concerné par la réplication de l'étude, une fois la carte retournée, vous avez maintenant 100% de conviction sur ce qu'est la carte et 0% de conviction qu'elle pourrait prendre toute autre valeur. Pour les Bayésiens, la probabilité est une mesure de croyance.
Notez que les Bayésiens n'ont pas d' intervalles de confiance pour cette raison, ils résument l'incertitude avec des intervalles de crédibilité .
la source