Exemples de coïncidence entre l'intervalle de confiance et l'intervalle crédible

11

Dans l'article de Wikipédia sur l' intervalle crédible , il est dit:

Dans le cas d'un seul paramètre et de données qui peuvent être résumées en une seule statistique suffisante, il peut être démontré que l'intervalle crédible et l'intervalle de confiance coïncideront si le paramètre inconnu est un paramètre de localisation (c'est-à-dire que la fonction de probabilité directe a la forme Pr (x | μ) = f (x - μ)), avec un a priori qui est une distribution uniforme uniforme; [5] et aussi si le paramètre inconnu est un paramètre d'échelle (c'est-à-dire que la fonction de probabilité directe a la forme Pr (x | s) = f (x / s)), avec un a priori de Jeffreys [5] - ce dernier suivant parce que la prise du logarithme d'un tel paramètre d'échelle le transforme en paramètre d'emplacement avec une distribution uniforme. Mais ce sont des cas très particuliers (quoique importants); en général, aucune équivalence ne peut être établie. "

Les gens pourraient-ils en donner des exemples spécifiques? Quand l'IC à 95% correspond-il réellement à "95% de chances", "violant" ainsi la définition générale de l'IC?

Wayne
la source

Réponses:

13

distribution normale:

Prenez une distribution normale avec une variance connue. On peut prendre cette variance à 1 sans perdre la généralité (en divisant simplement chaque observation par la racine carrée de la variance). Cela a une distribution d'échantillonnage:

p(X1...XN|μ)=(2π)-N2exp(-12je=1N(Xje-μ)2)=UNEexp(-N2(X¯-μ)2)

est une constante qui ne dépend que des données. Cela montre que la moyenne de l'échantillon est une statistique suffisante pour la moyenne de la population. Si nous utilisons un a priori uniforme, la distribution postérieure de μ sera:UNEμ

(μ|X1...XN)Normunel(X¯,1N)(N(μ-X¯)|X1...XN)Normunel(0,1)

Ainsi, un intervalle crédible sera de la forme:1-α

(X¯+1NLα,X¯+1NUα)

et U α sont choisis de telle sorte qu'une variable aléatoire normale normale Z satisfasse:LαUαZ

Pr(Lα<Z<Uα)=1-α

Nous pouvons maintenant partir de cette "quantité pivot" pour construire un intervalle de confiance. La distribution d'échantillonnage de pourμfixeest une distribution normale standard, nous pouvons donc la remplacer par la probabilité ci-dessus:N(μ-X¯)μ

Pr(Lα<N(μ-X¯)<Uα)=1-α

Réorganisez ensuite la résolution pour , et l'intervalle de confiance sera le même que l'intervalle crédible.μ

Paramètres d'échelle:

Pour les paramètres d'échelle, les pdfs ont la forme . On peut prendre le(Xi|s)Uniform(0,s), ce qui correspond àf(t)=1. La distribution d'échantillonnage conjointe est:p(Xje|s)=1sF(Xjes)(Xje|s)UnjeForm(0,s)F(t)=1

p(X1...XN|s)=s-N0<X1...XN<s

XmuneX

Pr(XmuneX<y|s)=Pr(X1<y,X2<y...XN<y|s)=(ys)N

y=qsQ=s-1XmuneXPr(Q<q)=qNbetune(N,1)Lα,Uα

Pr(Lα<Q<Uα)=1-α=UαN-LαN

Et nous substituons la quantité pivot:

Pr(Lα<s-1XmuneX<Uα)=1-α=Pr(XmuneXLα-1>s>XmuneXUα-1)

Et il y a notre intervalle de confiance. Pour la solution bayésienne avec les jeffreys, nous avons:

p(s|X1...XN)=s-N-1XmuneXr-N-1r=N(XmuneX)Ns-N-1
Pr(s>t|X1...XN)=N(XmuneX)Nts-N-1s=(XmuneXt)N

Nous branchons maintenant l'intervalle de confiance et calculons sa crédibilité

Pr(XmuneXLα-1>s>XmuneXUα-1|X1...XN)=(XmuneXXmuneXUα-1)N-(XmuneXXmuneXLα-1)N

=UαN-LαN=Pr(Lα<Q<Uα)

1-α

probabilitéislogique
la source
Un chef-d'œuvre, merci! J'espérais qu'il pourrait y avoir une réponse comme, "lors du calcul de la moyenne d'un échantillon à partir d'une distribution normale, l'IC à 95% est en fait également l'intervalle crédible à 95%" ou quelque chose de simple comme ça. (Juste pour inventer cette supposée réponse, je n'ai aucune idée d'exemples spécifiques.)
Wayne
Je crois qu'un intervalle de prédiction / tolérance fréquentiste à 95% correspond à un intervalle de prédiction bayésien avec régression OLS et erreurs normales. Il semble donc que lorsque je compare la réponse de Predict.lm à une réponse simulée, de toute façon. Est-ce vrai?
Wayne
Oui=α+βXα,βσ
Grand merci! J'ai essayé d'expliquer un IC pour une régression que j'ai faite en termes d'intervalle de confiance, et il ne se connecte tout simplement pas à un public profane, qui attend un intervalle crédible. Rend la vie beaucoup plus facile pour moi ... bien que ce soit peut-être mauvais pour le monde statistique global, car cela renforcera la mauvaise compréhension par le profane des IC.
Wayne
@Wayne - la situation est un peu plus générale que les familles à échelle géographique. Habituellement, un IC sera équivalent à un intervalle crédible, s'il est basé sur une "statistique suffisante" (comme ces deux-là) là où elle existe. S'il n'y a pas de statistiques suffisantes, alors l'IC doit se soumettre à ce qu'on appelle des "statistiques auxiliaires" pour avoir une interprétation crédible des intervalles.
probabilislogic