Exemples de coïncidence entre l'intervalle de confiance et l'intervalle crédible

distribution normale:

Prenez une distribution normale avec une variance connue. On peut prendre cette variance à 1 sans perdre la généralité (en divisant simplement chaque observation par la racine carrée de la variance). Cela a une distribution d'échantillonnage:

p (X_{1} . . . X_{N} | μ) = {(2 π)}^{- \frac{N}{2}} \exp (- \frac{1}{2} \sum_{je = 1}^{N} (X_{je} - μ)^{2}) = UNE \exp (- \frac{N}{2} (\bar{X} - μ)^{2})

$p(X_{1}...X_{N}|\mu)=\left(2\pi\right)^{-\frac{N}{2}}\exp\left(-\frac{1}{2}\sum_{i=1}^{N}(X_{i}-\mu)^{2}\right)=A\exp\left(-\frac{N}{2}(\overline{X}-\mu)^{2}\right)$

Où est une constante qui ne dépend que des données. Cela montre que la moyenne de l'échantillon est une statistique suffisante pour la moyenne de la population. Si nous utilisons un a priori uniforme, la distribution postérieure de sera: $A$ $\mu$

(μ | X_{1} . . . X_{N}) \sim N o r m une l (\bar{X}, \frac{1}{N}) ⟹ (\sqrt{N} (μ - \bar{X}) | X_{1} . . . X_{N}) \sim N o r m une l (0, 1)

$(\mu|X_{1}...X_{N})\sim Normal\left(\overline{X},\frac{1}{N}\right)\implies \left(\sqrt{N}(\mu-\overline{X})|X_{1}...X_{N}\right)\sim Normal(0,1)$

Ainsi, un intervalle crédible sera de la forme: $1-\alpha$

(\bar{X} + \frac{1}{\sqrt{N}} L_{α}, \bar{X} + \frac{1}{\sqrt{N}} U_{α})

$\left(\overline{X}+\frac{1}{\sqrt{N}}L_{\alpha},\overline{X}+\frac{1}{\sqrt{N}}U_{\alpha}\right)$

Où et sont choisis de telle sorte qu'une variable aléatoire normale normale satisfasse: $L_{\alpha}$ $U_{\alpha}$ $Z$

P r (L_{α} < Z < U_{α}) = 1 - α

$Pr\left(L_{\alpha}<Z<U_{\alpha}\right)=1-\alpha$

Nous pouvons maintenant partir de cette "quantité pivot" pour construire un intervalle de confiance. La distribution d'échantillonnage de pourfixeest une distribution normale standard, nous pouvons donc la remplacer par la probabilité ci-dessus: $\sqrt{N}(\mu-\overline{X})$ $\mu$

P r (L_{α} < \sqrt{N} (μ - \bar{X}) < U_{α}) = 1 - α

$Pr\left(L_{\alpha}<\sqrt{N}(\mu-\overline{X})<U_{\alpha}\right)=1-\alpha$

Réorganisez ensuite la résolution pour , et l'intervalle de confiance sera le même que l'intervalle crédible. $\mu$

Paramètres d'échelle:

Pour les paramètres d'échelle, les pdfs ont la forme . On peut prendre le, ce qui correspond à. La distribution d'échantillonnage conjointe est: $p(X_{i}|s)=\frac{1}{s}f\left(\frac{X_{i}}{s}\right)$ $(X_{i}|s)\sim Uniform(0,s)$ $f(t)=1$

p (X_{1} . . . X_{N} | s) = s^{- N} 0 < X_{1} . . . X_{N} < s

$p(X_{1}...X_{N}|s)=s^{-N}\;\;\;\;\;\;\;0<X_{1}...X_{N}<s$

$X_{max}$

P r (X_{m une X} < y | s) = P r (X_{1} < y, X_{2} < y . . . X_{N} < y | s) = {(\frac{y}{s})}^{N}

$Pr(X_{max}<y|s)=Pr(X_{1}<y,X_{2}<y...X_{N}<y|s)=\left(\frac{y}{s}\right)^{N}$

$y=qs$ $Q=s^{-1}X_{max}$ $Pr(Q<q)=q^{N}$ $beta(N,1)$ $L_{\alpha},U_{\alpha}$

P r (L_{α} < Q < U_{α}) = 1 - α = U_{α}^{N} - L_{α}^{N}

$Pr(L_{\alpha}<Q<U_{\alpha})=1-\alpha=U_{\alpha}^{N}-L_{\alpha}^{N}$

Et nous substituons la quantité pivot:

P r (L_{α} < s^{- 1} X_{m une X} < U_{α}) = 1 - α = P r (X_{m une X} L_{α}^{- 1} > s > X_{m une X} U_{α}^{- 1})

$Pr(L_{\alpha}<s^{-1}X_{max}<U_{\alpha})=1-\alpha=Pr(X_{max}L_{\alpha}^{-1}>s>X_{max}U_{\alpha}^{-1})$

Et il y a notre intervalle de confiance. Pour la solution bayésienne avec les jeffreys, nous avons:

p (s | X_{1} . . . X_{N}) = \frac{s^{- N - 1}}{\int_{X_{m une X}}^{\infty} r^{- N - 1} ré r} = N (X_{m une X})^{N} s^{- N - 1}

$p(s|X_{1}...X_{N})=\frac{s^{-N-1}}{\int_{X_{max}}^{\infty}r^{-N-1}dr}=N (X_{max})^{N}s^{-N-1}$

⟹ P r (s > t | X_{1} . . . X_{N}) = N (X_{m une X})^{N} \int_{t}^{\infty} s^{- N - 1} ré s = {(\frac{X_{m une X}}{t})}^{N}

$\implies Pr(s>t|X_{1}...X_{N})=N (X_{max})^{N}\int_{t}^{\infty}s^{-N-1}ds=\left(\frac{X_{max}}{t}\right)^{N}$

Nous branchons maintenant l'intervalle de confiance et calculons sa crédibilité

P r (X_{m une X} L_{α}^{- 1} > s > X_{m une X} U_{α}^{- 1} | X_{1} . . . X_{N}) = {(\frac{X_{m une X}}{X_{m une X} U_{α}^{- 1}})}^{N} - {(\frac{X_{m une X}}{X_{m une X} L_{α}^{- 1}})}^{N}

$Pr(X_{max}L_{\alpha}^{-1}>s>X_{max}U_{\alpha}^{-1}|X_{1}...X_{N})=\left(\frac{X_{max}}{X_{max}U_{\alpha}^{-1}}\right)^{N}-\left(\frac{X_{max}}{X_{max}L_{\alpha}^{-1}}\right)^{N}$

= U_{α}^{N} - L_{α}^{N} = P r (L_{α} < Q < U_{α})

$=U_{\alpha}^{N}-L_{\alpha}^{N}=Pr(L_{\alpha}<Q<U_{\alpha})$

$1-\alpha$

probabilitéislogique
la source

Un chef-d'œuvre, merci! J'espérais qu'il pourrait y avoir une réponse comme, "lors du calcul de la moyenne d'un échantillon à partir d'une distribution normale, l'IC à 95% est en fait également l'intervalle crédible à 95%" ou quelque chose de simple comme ça. (Juste pour inventer cette supposée réponse, je n'ai aucune idée d'exemples spécifiques.)

Wayne

Je crois qu'un intervalle de prédiction / tolérance fréquentiste à 95% correspond à un intervalle de prédiction bayésien avec régression OLS et erreurs normales. Il semble donc que lorsque je compare la réponse de Predict.lm à une réponse simulée, de toute façon. Est-ce vrai?

Wayne

Y = α + β X

$Y=\alpha+\beta X$

α, β

$\alpha,\beta$

σ

$\sigma$

Grand merci! J'ai essayé d'expliquer un IC pour une régression que j'ai faite en termes d'intervalle de confiance, et il ne se connecte tout simplement pas à un public profane, qui attend un intervalle crédible. Rend la vie beaucoup plus facile pour moi ... bien que ce soit peut-être mauvais pour le monde statistique global, car cela renforcera la mauvaise compréhension par le profane des IC.

Wayne

@Wayne - la situation est un peu plus générale que les familles à échelle géographique. Habituellement, un IC sera équivalent à un intervalle crédible, s'il est basé sur une "statistique suffisante" (comme ces deux-là) là où elle existe. S'il n'y a pas de statistiques suffisantes, alors l'IC doit se soumettre à ce qu'on appelle des "statistiques auxiliaires" pour avoir une interprétation crédible des intervalles.

probabilislogic

Exemples de coïncidence entre l'intervalle de confiance et l'intervalle crédible

Réponses:

distribution normale:

Paramètres d'échelle: