Il semble que, grâce à diverses questions connexes, il existe un consensus sur le fait que la partie "95%" de ce que nous appelons un "intervalle de confiance à 95%" fait référence au fait que si nous reproduisions exactement nos procédures d'échantillonnage et de calcul CI , 95% des IC ainsi calculés contiendraient la moyenne de la population. Il semble également que l’on s’accorde à dire que cette définition n’est paspermet de conclure d’un seul IC à 95% qu’il existe une probabilité de 95% que la moyenne se situe quelque part dans l’IC. Cependant, je ne comprends pas comment le premier n’implique pas le dernier dans la mesure où, après avoir imaginé de nombreux IC contenant 95% de la moyenne de la population, notre incertitude ne devrait pas moyenne ou non) nous oblige à utiliser le taux de base des cas imaginés (95%) comme notre estimation de la probabilité que notre cas réel contienne l’IC?
J'ai vu des publications se disputer entre "l'IC réellement calculé contient ou non la moyenne de la population, donc sa probabilité est de 1 ou 0", mais cela semble impliquer une définition étrange de la probabilité qui est dépendante. sur des états inconnus (c'est-à-dire qu'un ami lance une pièce de monnaie équitable, cache le résultat, et il m'est interdit de dire qu'il y a 50% de chances qu'il s'agisse de têtes).
Sûrement je me trompe, mais je ne vois pas où ma logique a mal tourné ...
la source
Réponses:
Une partie du problème est que la définition fréquentiste de la probabilité ne permet pas d'appliquer une probabilité non triviale au résultat d'une expérience particulière, mais uniquement à une population fictive d'expériences à partir desquelles cette expérience particulière peut être considérée comme un échantillon. La définition d'un élément de configuration est source de confusion car il s'agit d'une déclaration concernant cette population d'expériences (généralement) fictive, plutôt que sur les données particulières collectées dans l'instance concernée. Donc, une partie du problème est liée à la définition d’une probabilité: l’idée de la valeur vraie située dans un intervalle particulier avec une probabilité de 95% est incompatible avec un cadre fréquentiste.
Un autre aspect du problème réside dans le fait que le calcul de la confiance fréquentiste n’utilise pas toutes les informations contenues dans l’échantillon particulier pertinentes pour délimiter la valeur réelle de la statistique. Ma question "Existe-t-il des exemples où les intervalles crédibles bayésiens sont évidemment inférieurs aux intervalles de confiance fréquentistes"discute d'un article de Edwin Jaynes qui contient de très bons exemples qui soulignent vraiment la différence entre les intervalles de confiance et les intervalles crédibles. L’exemple 5, qui présente un intérêt particulier pour cette discussion, traite de la différence entre un intervalle de confiance et un intervalle de confiance permettant d’estimer le paramètre d’une distribution exponentielle tronquée (pour un problème de contrôle de la qualité industrielle). Dans l'exemple qu'il donne, l'échantillon contient suffisamment d'informations pour être certain que la vraie valeur du paramètre ne se trouve nulle part dans un intervalle de confiance de 90% correctement construit!
Cela peut paraître choquant pour certains, mais la raison de ce résultat est que les intervalles de confiance et les intervalles crédibles sont des réponses à deux questions différentes, à partir de deux interprétations différentes de la probabilité.
L'intervalle de confiance est la réponse à la demande: « Donne - moi un intervalle qui la valeur réelle entre crochets du paramètre dans % des cas d'une expérience qui se répète un grand nombre de fois. » L’intervalle crédible est une réponse à la demande: "Donnez-moi un intervalle qui encadre la valeur vraie avec la probabilité p en fonction de l’échantillon particulier que j’ai observé. " Pour pouvoir répondre à cette dernière demande, nous devons d’abord adopter soit ) un nouveau concept du processus de génération de données ou b) un concept différent de la définition de la probabilité elle-même.100p p
La raison principale pour laquelle un intervalle de confiance de 95% n'implique pas une probabilité de contenir la moyenne de 95% est parce que l'intervalle de confiance est une réponse à une question différente, c'est donc la bonne réponse uniquement lorsque la réponse aux deux questions se présente. avoir la même solution numérique.
En bref, les intervalles de confiance et de confiance répondent à des questions différentes selon des perspectives différentes. les deux sont utiles, mais vous devez choisir le bon intervalle pour la question que vous voulez réellement poser. Si vous voulez un intervalle qui permette d'interpréter une probabilité de 95% (postérieur) de contenir la valeur vraie, choisissez un intervalle crédible (et, avec lui, la conceptualisation correspondante de la probabilité), et non un intervalle de confiance. Ce que vous ne devriez pas faire est d’adopter une interprétation de la probabilité différente de celle utilisée dans l’analyse.
Merci à cardinal pour ses raffinements!
Voici un exemple concret tiré de l'excellent livre de David MaKay intitulé "Théorie de l'information, algorithmes d'inférence et d'apprentissage" (page 464):
Soit le paramètre d'intérêt soit et la donnée D , une paire de points x 1 et x 2 tirée indépendamment de la distribution suivante:θ D x1 x2
Si est 39 , alors nous attendons à voir les jeux de données ( 39 , 39 ) , ( 39 , 40 ) , ( 40 , 39 ) et ( 40 , 40 ) tout avec une probabilité égale 1 / 4 . Considérons l'intervalle de confianceθ 39 (39,39) (39,40) (40,39) (40,40) 1/4
.[θmin(D),θmax(D)]=[min(x1,x2),max(x1,x2)]
Il s'agit clairement d'un intervalle de confiance valide à 75%, car si vous ré-échantillonniez les données, , l'intervalle de confiance ainsi défini contiendrait souvent la valeur vraie 75% du temps.D=(x1,x2)
Considérons maintenant les données . Dans ce cas, l'intervalle de confiance fréquentiste de 75% serait [ 29 , 29 ] . Cependant, en supposant que le modèle du processus de génération soit correct, θ pourrait être 28 ou 29 dans ce cas, et nous n'avons aucune raison de supposer que 29 est plus probable que 28, la probabilité a posteriori est donc p ( θ = 28 | D ) = p ( θ = 29 | D ) = 1 / 2D=(29,29) [29,29] θ p(θ=28|D)=p(θ=29|D)=1/2 . Ainsi, dans ce cas, l’intervalle de confiance fréquentiste n’est clairement pas un intervalle de confiance de 75%, car il n’ya que 50% de probabilité qu’il contienne la valeur réelle de , compte tenu de ce que nous pouvons déduire de l’échantillon à propos de θ .θ θ
Oui, il s'agit d'un exemple artificiel, mais si les intervalles de confiance et les intervalles crédibles ne différaient pas, ils seraient toujours identiques dans les exemples artificiels.
Notez que la différence principale est que l'intervalle de confiance est une indication de ce qui se produirait si vous répétiez l'expérience plusieurs fois, l'intervalle crédible est une indication de ce qui peut être déduit de cet échantillon particulier.
la source
Dans les statistiques fréquentistes, les probabilités concernent les événements à long terme. Ils ne s'appliquent tout simplement pas à un seul événement une fois que c'est fait. Et le déroulement d'une expérience et le calcul de l'IC est un tel événement.
Vous vouliez comparer cela à la probabilité qu'une pièce cachée soit une tête, mais vous ne pouvez pas. Vous pouvez le relier à quelque chose de très proche. Si votre jeu comportait une règle selon laquelle vous devez énoncer après le retournement "les têtes", la probabilité que vous ayez raison à long terme est de 50%, ce qui est analogue.
Lorsque vous exécutez votre test et collectez vos données, vous obtenez quelque chose de similaire au lancer réel de la pièce. Le processus de l'expérience est comme le processus de retournement de la pièce en ce qu'elle génèreμ ou ce n'est pas juste comme la pièce de monnaie est des têtes ou ce n'est pas. Une fois que vous avez lancé la pièce, que vous la voyiez ou non, il n’y avait aucune probabilité que ce soit la tête, que ce soit la tête ou non. Supposons maintenant que vous appelez des têtes. C'est ce que calcule l'IC. Parce que vous ne pouvez jamais révéler la pièce (votre analogie avec une expérience disparaîtrait). Vous avez raison ou vous avez tort, c'est tout. Est-ce que son état actuel a un lien avec la probabilité qu'il se présente à la prochaine tentative, ou que j'aurais pu prédire ce que c'est? Non. Le processus selon lequel la tête est produite a une probabilité de 0,5 de les produire, mais cela ne signifie pas qu'une tête qui existe déjà a une probabilité de 0,5. Une fois que vous calculez votre CI , il n'y a aucune probabilité qu'il capture μ , que ce soit ou non, vous avez déjà lancé la pièce.
OK, je pense avoir assez torturé cela. Le point critique est vraiment que votre analogie est erronée. Vous ne pouvez jamais révéler la pièce; vous ne pouvez appeler que des têtes ou des queues basées sur des suppositions concernant des pièces (expériences). Vous voudrez peut-être parier par la suite que vos têtes et vos queues sont correctes, mais vous ne pourrez jamais en récolter. En outre, vous déclarez que la valeur de l'import est dans l'intervalle est un élément essentiel de la procédure de CI. Si vous ne le faites pas, vous n'avez pas de CI (ou du moins, pas un%).
Ce qui rend le CI confus, c'est probablement son nom. C'est une plage de valeurs qui contiennent ou non . Nous pensons qu'ils contiennent des µ, mais la probabilité que cela soit différent du processus suivi pour les développer. La partie à 95% du nom à 95% de l'IC correspond à peu près au processus. Vous pouvez calculer une plage qui, à votre avis, contient par la suite µ à un certain niveau de probabilité, mais il s’agit d’un calcul différent et non d’un IC.μ μ μ
Il est préférable de penser au nom 95% IC comme désignation d'une sorte de mesure d'une plage de valeurs que vous pensez contenir plausiblement et séparez les 95% de cette plausibilité. Nous pourrions l'appeler Jennifer CI, alors que l'IC à 99% est l'IC Wendy. Cela pourrait effectivement être mieux. Ensuite, après, nous pouvons dire que nous pensons que μ est susceptible de figurer dans la plage de valeurs et que personne ne resterait coincé en disant qu'il existe une probabilité de Wendy que nous ayons capturé μ . Si vous souhaitez une désignation différente, je pense que vous devriez probablement vous sentir libre de vous débarrasser de la partie "confiance" de CI aussi (mais c'est un intervalle).μ μ μ
la source
Les idées formelles et explicites sur les arguments, l'inférence et la logique ont pour origine, dans la tradition occidentale, Aristote. Aristotle a écrit sur ces sujets dans plusieurs ouvrages différents (dont un intitulé Topics ;-)). Cependant, le principe fondamental le plus fondamental est la loi de la non-contradiction , qui peut être trouvée dans divers endroits, y compris la métaphysique.livre IV, chapitres 3 et 4. Une formulation typique est la suivante: "... il est impossible que rien au même moment soit et ne soit pas [dans le même sens]" (1006 a 1). Son importance est mentionnée un peu plus tôt: "... c'est naturellement le point de départ, même pour tous les autres axiomes" (1005 b 30). Pardonnez-moi d’être philosophique, mais cette question, de par sa nature, a un contenu philosophique qui ne peut être simplement écarté pour des raisons de commodité.
Considérez cette expérience de pensée: Alex lance une pièce de monnaie, l'attrape et la retourne sur son avant-bras avec sa main couvrant le côté tourné vers le haut. Bob se tenait dans la bonne position; il a brièvement vu la pièce dans la main d'Alex et peut ainsi en déduire quel côté est face maintenant. Cependant, Carlos n'a pas vu la pièce - il n'était pas au bon endroit. À ce stade, Alex leur demande quelle est la probabilité que la pièce montre des têtes. Carlos suggère que la probabilité est de 0,5, car c'est la fréquence à long terme des têtes. Bob n'est pas d'accord, il affirme avec assurance que la probabilité n'est rien d'autre que 0 .
Maintenant, qui a raison? Il est possible, bien sûr, que Bob ait mal vu et qu’il soit incorrect (supposons qu’il n’a pas mal vu). Néanmoins, vous ne pouvez pas affirmer que les deux ont raison et respectez la loi de la non-contradiction. (Je suppose que si vous ne croyez pas en la loi de la non-contradiction, vous pourriez penser qu'ils ont tous les deux raison, ou une autre formulation du même genre.) Imaginez maintenant un cas similaire, mais sans la présence de Bob, la suggestion de Carlos pourrait-elle être plus droit (eh?) sans Bob autour, puisque personne n'a vu la pièce? L'application de la loi de la non-contradiction n'est pas aussi claire en l'espèce, mais je pense qu'il est évident que les parties de la situation qui semblent importantes sont maintenues constantes des premières aux dernières. Il y a eu beaucoup de tentatives pour définir la probabilité, et à l'avenir, il pourrait encore en être beaucoup plus, mais une définition de la probabilité en fonction de qui se trouve et de l'endroit où elles se trouvent n'a que peu d'intérêt. En tout cas (deviner par votre utilisation de la phrase "intervalle de confiance "), nous travaillons dans le cadre de l’approche Frequentist et il n’est pas pertinent de savoir si le véritable état de la pièce de monnaie est sans importance. Ce n’est pas une variable aléatoire - c’est une valeur réalisée et elle montre des têtes .
Comme le note @John, l'état d'une pièce de monnaie peut ne pas sembler à première vue semblable à la question de savoir si un intervalle de confiance couvre la vraie moyenne. Cependant, au lieu d’une pièce de monnaie, nous pouvons comprendre cela abstraitement comme une valeur réalisée tirée d’une distribution de Bernoulli avec le paramètre . Dans la situation de pièce, p = 0,5 , alors que pour un IC à 95%, p = 0,95 . Ce qu'il est important de comprendre en établissant la connexion, c'est que la partie importante de la métaphore n'est pas le p qui gouverne la situation, mais plutôt que la pièce retournée ou l' IC calculé est une valeur réalisée , pas une variable aléatoire.p p=.5 p=.95 p
Il est important pour moi de noter à ce stade que tout cela est le cas dans une conception Frequentist de la probabilité. La perspective bayésienne ne viole pas la loi de la non-contradiction, elle part simplement de différentes hypothèses métaphysiques sur la nature de la réalité (plus précisément sur la probabilité). D'autres sur CV connaissent beaucoup mieux la perspective bayésienne que moi, et expliquent peut-être pourquoi les hypothèses qui sous-tendent votre question ne s'appliquent pas à l'approche bayésienne, et qu'en réalité, la probabilité moyenne peut être de 95%. se situant dans une limite de crédibilité de 95%intervalle, dans certaines conditions, y compris (entre autres) que le précédent utilisé était exact (voir le commentaire de @DikranMarsupial ci-dessous). Cependant, je pense que tous conviendraient qu'une fois que vous déclarez que vous travaillez dans l'approche Frequentist, il ne peut pas être vrai que la probabilité que la vraie moyenne se situe dans un intervalle de confiance particulier à 95% est de 0,95.
la source
Pourquoi un IC à 95% n'implique-t-il pas une probabilité de 95% de contenir la moyenne?
De nombreuses questions doivent être clarifiées dans cette question et dans la majorité des réponses données. Je me limiterai à deux d'entre eux.
une. Qu'est-ce qu'une population signifie? Existe-t-il une vraie population?
Le concept de moyenne de population dépend du modèle. Comme tous les modèles sont erronés, mais que certains sont utiles, cette population est une fiction définie uniquement pour fournir des interprétations utiles. La fiction commence par un modèle de probabilité.
Le modèle de probabilité est défini par le triplet où X est l’espace échantillon (un ensemble non vide), F est une famille de sous-ensembles de X et P est une mesure de probabilité bien définie définie sur F (il régit le comportement des données). Sans perte de généralité, considérons uniquement le cas discret. La moyenne de la population est définie par μ = et peut également être interprétée comme le centre de masse de tous les points de
Dans la théorie des probabilités, la mesure est considérée comme connue, donc la moyenne de la population est accessible via l'opération simple ci-dessus. Cependant, en pratique, la probabilité P est à peine connue. Sans probabilité P , il est impossible de décrire le comportement probabiliste des données. Comme nous ne pouvons pas définir de probabilité précise P pour expliquer le comportement des données, nous définissons une famille M contenant des mesures de probabilité qui régissent (ou expliquent) éventuellement le comportement des données. Ensuite, le modèle statistique classique apparaît ( X , F , M ) . Le modèle ci - dessus est considéré comme un modèle paramétrique s'il existe ΘP P P P M
Notez que, pour chaque mesure probabilité , il existe une définition moyenne respective u & thetav = ΣPθ∈M
C’est-à-dire qu’il existe une famille de moyens de population{μ
L'approche bayésienne considère une probabilité a priori sur les sous - ensembles de (ou, ce qui revient, Θ ), mais dans ce post , je vais concentrer uniquement sur la version classique.M Θ
b. Quelle est la définition et le but d'un intervalle de confiance?
Comme mentionné ci-dessus, la moyenne de la population dépend du modèle et fournit des interprétations utiles. Cependant, nous avons une famille de moyennes de population, car le modèle statistique est défini par une famille de mesures de probabilité (chaque mesure de probabilité génère une moyenne de population). Par conséquent, sur la base d'une expérience, des procédures inférentielles devraient être utilisées afin d'estimer un petit ensemble (intervalle) contenant de bons candidats parmi les moyennes de population. Un procédé bien connu est la ( ) région de confiance, qui est définie par un ensemble C α de telle sorte que, pour tout & thetav ∈ & thetav1−α Cα θ∈Θ ,
= 0 (voir Schervish, 1995). Cette définition est très générale et englobe pratiquement tous les types d'intervalles de confiance. Ici, P θ ( C α ( X ) où P θ ( C α ( X ) = ∅ ) μ θ ) est la probabilité que C α ( X ) contienne μ θ∋
Remarque: Les lecteurs doivent noter qu'il n'est pas nécessaire de faire des hypothèses sur l'état de réalité. La région de confiance est définie pour un modèle statistique bien défini sans faire référence à une "vraie" moyenne. Même si la "vraie" mesure de probabilité n'existe pas ou n'est pas dans , la définition de la région de confiance fonctionnera, car les hypothèses portent sur la modélisation statistique plutôt que sur les états de réalité.M
D'une part, avant d' observer les données,Cα(X) est un ensemble aléatoire (ou intervalle aléatoire) et la probabilité que " contienne la moyenne µ θ " est au moins égale à ( 1 - α ) pour tout & thetav ∈ & thetav . C'est une caractéristique très souhaitable pour le paradigme fréquentiste.Cα(X) μθ (1−α) θ∈Θ
D'autre part, après avoir observé les données ,x n’est qu’un ensemble fixe et la probabilité que " C α ( x ) contienne la moyenne μ θ " doit être égale à {0,1} pour tout θ ∈ Θ .Cα(x) Cα(x) μθ θ∈Θ
C'est-à-dire qu'après l' observation des données , nous ne pouvons plus utiliser le raisonnement probabiliste. Autant que je sache, il n'y a pas de théorie pour traiter les ensembles de confiance pour un échantillon observé (j'y travaille et j'obtiens de bons résultats). Pendant quelque temps, le fréquentiste doit croire que l'ensemble observé (ou l'intervalle) Cx est l’un des ensembles ( 1 - α ) à 100 % contenantCα(x) (1−α)100% pour tout thetav ∈ & thetav .μθ θ∈Θ
PS: J'invite tous les commentaires, critiques, critiques ou même les objections à mon message. Discutons-en en profondeur. Comme je ne parle pas anglais couramment, mon post contient sûrement des fautes de frappe et des fautes de grammaire.
Référence:
Schervish, M. (1995), Theory of Statistics, deuxième éd., Springer.
la source
Je suis surpris que personne n'ait évoqué l'exemple d'un intervalle de confiance à 75% essentiellement inutile décrit dans le deuxième chapitre de "Le principe de vraisemblance". Les détails se trouvent dans le texte original ( disponible gratuitement sur Project Euclid ): ce qui est essentiel dans cet exemple, c’est qu’il décrit sans ambiguïté une situation dans laquelle vous connaissez avec une certitude absolue la valeur d’un paramètre apparemment inconnu après observer les données, mais vous affirmeriez que vous n’avez que 75% de confiance que votre intervalle contient la valeur vraie. Travailler à travers les détails de cet exemple m'a permis de comprendre toute la logique de la construction d'intervalles de confiance.
la source
Je ne sais pas si cette question devrait être posée comme une nouvelle question, mais elle répond à la même question posée ci-dessus en proposant une expérience de pensée.
Premièrement, je vais supposer que si je sélectionne une carte à jouer au hasard dans un jeu standard, la probabilité que j'ai choisi un club (sans le regarder) est de 13/52 = 25%.
Et deuxièmement, il a été dit à maintes reprises qu’un intervalle de confiance de 95% devait être interprété en termes de répétition d’une expérience plusieurs fois et que l’intervalle calculé contiendrait la moyenne réelle dans 95% des cas - je pense que cela a été démontré de manière assez convaincante par James Waters. simulation. La plupart des gens semblent accepter cette interprétation d'un IC à 95%.
Maintenant, pour l'expérience de pensée. Supposons que nous ayons une variable normalement distribuée dans une large population - peut-être la hauteur d'hommes ou de femmes adultes. J'ai un assistant volontaire et infatigable à qui je confie l'exécution de plusieurs processus d'échantillonnage d'une taille donnée de la population et le calcul de la moyenne de l'échantillon et de l'intervalle de confiance de 95% pour chaque échantillon. Mon assistant est très enthousiaste et parvient à mesurer tous les échantillons possibles de la population. Ensuite, pour chaque échantillon, mon assistant enregistre l'intervalle de confiance obtenu en vert (si le CI contient la moyenne vraie) ou en rouge (si le CI ne contient pas la moyenne vraie). Malheureusement, mon assistant ne me montrera pas les résultats de ses expériences. J'ai besoin d'informations sur les tailles des adultes dans la population mais je n'ai que le temps, ressources et patience pour faire l'expérience une fois. Je fais un seul échantillon aléatoire (de la même taille que celle utilisée par mon assistant) et calcule l'intervalle de confiance (en utilisant la même équation).
Je n'ai aucun moyen de voir les résultats de mon assistant. Alors, quelle est la probabilité que l’échantillon aléatoire que j’ai sélectionné produise un IC vert (c’est-à-dire que l’intervalle contient la moyenne vraie)?
Dans mon esprit, ceci est identique à la situation de jeu de cartes décrite précédemment et peut être interprété comme une probabilité de 95% que l'intervalle calculé contienne la moyenne vraie (c'est-à-dire qu'elle est verte). Et pourtant, le consensus semble être qu'un intervalle de confiance de 95% ne peut PAS être interprété comme une probabilité de 95% que l'intervalle contienne la moyenne vraie. Pourquoi (et où) mon raisonnement dans l'expérience de pensée ci-dessus s'effondre?
la source
Ainsi, au lieu de donner des informations sur la probabilité que le paramètre soit contenu dans l’intervalle, il donne des informations sur la probabilité que l’intervalle contenant le paramètre soit défini, l’intervalle étant constitué de variables aléatoires.
la source
Pour des raisons pratiques, vous n'avez pas plus tort de parier que votre IC à 95% comprenait la vraie moyenne à 95: 5, que de miser sur le tirage de la pièce de votre ami à 50:50.
Si votre ami a déjà lancé la pièce et que vous pensez qu'il existe une probabilité de 50% de ce soit une tête, alors vous utilisez simplement une définition différente du mot probabilité. Comme d'autres l'ont dit, pour les fréquentistes, vous ne pouvez pas attribuer une probabilité à un événement survenu, mais vous pouvez plutôt décrire la probabilité qu'un événement se produise dans le futur à l'aide d'un processus donné.
Sur un autre blog: Le fréquentiste dira: "Un événement particulier ne peut avoir aucune probabilité. La pièce représente soit la tête, soit la queue, et à moins que vous ne le montriez, je ne peux simplement pas dire quel est le fait. Seulement si vous répétiez le tirage au sort Bien souvent, si vous modifiez suffisamment les conditions initiales des lancers, je m'attendrais à ce que la fréquence relative des têtes dans tous ces lancers approche de 0,5 ". http://www.researchgate.net/post/What_is_the_difference_between_frequentist_and_bayesian_probability
la source
Supposons que l’IC calculé à partir de l’ensemble de données dont vous disposez est l’un des 5% d’IC possibles ne contenant pas la moyenne. Dans quelle mesure croyez-vous que cet intervalle de confiance est de 95%? (Autrement dit, dans quelle mesure est-il proche de contenir la moyenne avec une probabilité de 95%?) Vous n'avez aucune assurance que ce soit proche du tout. En fait, votre IC ne peut pas chevaucher même un seul des 95% des IC à 95% qui contiennent réellement la moyenne. Sans parler du fait qu'il ne contient pas la moyenne elle-même, ce qui suggère également que ce n'est pas un intervalle crédible à 95%.
Peut-être voudrez-vous ignorer cela et présumer avec optimisme que votre CI est l’un des 95% qui contient la moyenne. OK, que savons-nous de votre IC, étant donné qu'il fait partie des 95%? Qu'il contient la moyenne, mais peut-être la seule issue à l'extrême, excluant tout le reste de l'autre côté de la moyenne. Non susceptible de contenir 95% de la distribution.
Quoi qu'il en soit, rien ne garantit, peut-être même pas un espoir raisonnable, que votre intervalle de confiance à 95% correspond à un intervalle de confiance à 95%.
la source
Si vous devinez seulement que vos amis lancent une pièce avec 50% de têtes / queues, vous ne le faites pas correctement.
La crédibilité de votre conjecture à propos du jeton dépendra certainement de ces conditions et ne sera pas toujours la même (50%) (votre méthode de "tricherie" fonctionnera parfois mieux).
Votre hypothèse générale pourrait être que, si vous trichez, x> 50% du temps soit correct, mais cela ne signifie pas nécessairement que la probabilité pour chaque lancer particulier était toujours de x% de la tête. Il serait donc un peu étrange de projeter votre probabilité globale sur la probabilité d'un lancer spécifique. C'est un «type de probabilité» différent.
C'est un peu à quel niveau ou profondeur vous spécifiez / définissez "probabilité" .
La confiance est indépendante de la "probabilité spécifique dans l'expérience / retournement" et des "probabilités a priori" .
La confiance concerne le ensemble des expériences . Il est construit de sorte que vous n’ayez pas besoin de connaître les probabilités ou les distributions a priori dans la population.
La confiance est au sujet du général « taux d'échec » de l'estimation mais pour des cas particuliers on pourrait être en mesure de préciser plus précisément les variations de probabilité .
( Ces variations de probabilité existent au moins implicitement , en théorie, et nous n'avons pas besoin de les connaître pour qu'elles existent. Mais nous pouvons exprimer explicitement ces probabilités en utilisant une approche bayésienne).
Exemple 1:
Si vous avez 1% de la population malade, vous obtiendrez en moyenne 1,98% des tests positifs (1% des 99% des personnes en bonne santé et 99% des 1% des personnes malades). Cela rend votre intervalle de confiance à 95%, (conditionnel) lorsque vous rencontrez un test positif , à ne corriger que 50% du temps.
Exemple 2:
(l'inverse est vrai pour les personnes qui ont des résultats proches de 100, leur QI sera probablement plus probable que 95% dans les 95% -CI, et cela devrait compenser les erreurs que vous avez commises aux extrêmes, de sorte que vous finissez par avoir raison dans 95% des cas)
la source
D’abord, donnons une définition de l’intervalle de confiance ou, dans les espaces de dimension supérieure à un, de la région de confiance. La définition est une version concise de celle donnée par Jerzy Neyman dans son article de 1937 à la Royal Society.
L'exemple classique d'estimation d'une moyenne de population avec un intervalle de confiance standard construit autour d'une statistique normale est un cas particulier des hypothèses précédentes. Par conséquent , la norme 95% intervalle de confiance ne contient la moyenne avec une probabilité 0,95; mais cette correspondance ne tient généralement pas.
la source
Il y a quelques réponses intéressantes ici, mais j'ai pensé ajouter une petite démonstration pratique en utilisant R. Nous avons récemment utilisé ce code dans un cours de statistiques pour mettre en évidence le fonctionnement des intervalles de confiance. Voici ce que le code fait:
1 - Il échantillonne une distribution connue (n = 1000)
2 - Il calcule l'IC de 95% pour la moyenne de chaque échantillon
3 - Il demande si l'EC de chaque échantillon comprend ou non la vraie moyenne.
4 - Il indique dans la console la fraction d'EC qui incluait la vraie moyenne.
Je viens d'exécuter le script plusieurs fois et il n'est pas rare de constater que moins de 94% des CI contenaient la vraie moyenne. Au moins pour moi, cela permet de dissiper l'idée selon laquelle un intervalle de confiance a une probabilité de 95% de contenir le paramètre réel.
J'espère que cela t'aides!
la source