De nombreux intervalles de confiance fréquentistes (IC) sont basés sur la fonction de vraisemblance. Si la distribution a priori est vraiment non informative, alors le postérieur bayésien a essentiellement les mêmes informations que la fonction de vraisemblance. Par conséquent, dans la pratique, un intervalle de probabilité bayésien (ou intervalle crédible) peut être très similaire numériquement à un intervalle de confiance fréquentiste. [Bien sûr, même s'ils sont numériquement similaires, il existe des différences philosophiques d' interprétation entre les estimations de l'intervalle fréquentiste et bayésien.]
Voici un exemple simple, estimant la probabilité de réussite binomiale θ.
Supposons que nous ayons n=100 observations (essais) avec X=73 succès.
Frequentist: Les traditionnels intervalle Wald utilise l'estimation ponctuelle
θ = X / n = 73 / 100 = 0,73. Et l'IC à 95% est de la forme
& thetav ± 1,96 √θ^=X/n=73/100=0.73.
θ^±1.96θ^(1−θ^)n−−−−−−−−√,
qui calcule à
(0.643,0.817).
n = 100; x = 73; th.w = x/n; pm = c(-1,1)
ci.w = th.w + pm*1.96*sqrt(th.w*(1-th.w)/n); ci.w
[1] 0.6429839 0.8170161
Cette forme de CI suppose que les distributions binomiales pertinentes peuvent être approximées par des distributions normales et que la marge d'erreur est bien approximé par
√θ(1−θ)/n−−−−−−−−−√En particulier pour les petitsn,ces hypothèses n'ont pas besoin d'être vraies. [Les cas oùX=0ouX=nsont particulièrement problématiques.]θ^(1−θ^)/n−−−−−−−−−√.n,X=0X=n
Il a été démontré que le CI Agresti-Coull a une probabilité de couverture plus précise. Cet intervalle «ajoute deux succès et deux échecs» comme astuce pour obtenir une probabilité de couverture plus proche de 95%. Il commence par l'estimation ponctuelle
où ˜ n + 4. Alors un IC à 95% est de la forme
˜ θ ± 1,96 √θ~=(X+2)/n~,n~+4.
qui calcule à(0,612,0,792). Pourn>100et0,3<˜θ<0,7,la différence entre ces deux styles d'intervalles de confiance est presque négligeable.
θ~±1.96θ~(1−θ~)n~−−−−−−−−√,
(0.612,0.792).n>1000.3<θ~<0.7,
ci.a = th.a + pm*1.96*sqrt(th.a*(1-th.a)/n); ci.a
[1] 0.6122700 0.7915761
Bayésien:
Un avant non informatif populaire dans cette situation est La fonction de vraisemblance est proportionnelle à
θ x ( 1 - θ ) n - x . En multipliant les noyaux de l'a priori et de la vraisemblance, nous avons le noyau de la distribution postérieure
B e t a ( x + 1 ,Beta(1,1)≡Unif(0,1).θX( 1 - θ )n - x.B e t a (x+1,n - x + 1 ) .
Ensuite, une estimation de l'intervalle bayésien à 95% utilise les quantiles 0,025 et 0,975 de la distribution postérieure pour obtenir
Lorsque la distribution antérieure est «plate» ou «non informative», la différence numérique entre l'intervalle de probabilité bayésien et l'intervalle de confiance Agresti-Coull est faible.(0.635,0.807).
qbeta(c(.025, .975), 74, 28)
[1] 0.6353758 0.8072313
Notes: (a) Dans cette situation, certains bayésiens préfèrent l' a priori non (b) Pour des niveaux de confiance autres que 95%, l'IC Agresti-Coull utilise une estimation ponctuelle légèrement différente. (c) Pour les données autres que binomiales, il peut ne pas y avoir d'a priori «plat» disponible, mais on peut choisir un a priori avec une énorme variance (petite précision) qui contient très peu d'informations. (d) Pour une discussion plus approfondie des Agresti-Coull Kis, graphiques des probabilités de couverture, et quelques références, peut - être aussi voir ce Q & A .Beta(.5,.5).
Probabilité≠ Bayésienne avec a priori plat
La fonction de vraisemblance et l'intervalle de confiance associé ne sont pas les mêmes (concept) qu'une probabilité postérieure bayésienne construite avec un a priori qui spécifie une distribution uniforme.
Dans les parties 1 et 2 de cette réponse, il est expliqué pourquoi la probabilité ne devrait pas être considérée comme une probabilité postérieure bayésienne basée sur un a priori plat.
Dans la partie 3, un exemple est donné où l'intervalle de confiance et l'intervalle crédible varient considérablement. Il est également souligné comment cet écart se produit.
1 Comportement différent lorsque la variable est transformée
Les probabilités se transforment d'une manière particulière . Si nous connaissons la distribution de distribution de probabilitéfx(x) alors nous connaissons également la distribution de fξ(ξ) pour la variable ξ définie par n'importe quelle fonction x=χ(ξ) , selon la règle de transformation:
Si vous transformez une variable, la moyenne et le mode peuvent varier en raison de ce changement de la fonction de distribution. Cela signifiex¯≠χ(ξ¯) et xmaxf(x)≠χ(ξmaxf(ξ)) .
La fonction de vraisemblance ne se transforme pas de cette façon . Il s'agit des contrastes entre la fonction de vraisemblance et la probabilité postérieure. La fonction (maximum de) de vraisemblance reste la même lorsque vous transformez la variable.
En relation:
Le prieur plat est ambigu . Cela dépend de la forme de la statistique particulière.
Par exemple, siX est distribué uniformément (par exemple U(0,1)) , alors X2 n'est pas une variable distribuée uniforme.
2 Concept différent: les intervalles de confiance sont indépendants des précédents
Supposons que vous échantillonnez une variableX θ θ θ
L'intervalle de confiance n'utilise pas les informations d'un a priori comme le fait l'intervalle crédible (la confiance n'est pas une probabilité).
Dans le cas de l'intervalle crédible, ce concept (x
3 Différence entre la confiance et les intervalles crédibles
L'image ci-dessous illustre cette fonction de vraisemblance (la carte de couleur bleue), pour la taille de l'échantillonn=4
Les limites sont créées en obtenant la fonction de distribution cumulative (unidimensionnelle). Mais, cette intégration / cumul peut se faire dans deux directions .
La différence entre les intervalles se produit parce que les zones de 5% sont faites de différentes manières.
Un cas où l'intervalle de confiance et l'intervalle crédible (basé sur un a priori incorrect) coïncident est pour estimer la moyenne d'une variable distribuée gaussienne (la distribution est illustrée ici: https://stats.stackexchange.com/a/351333/164061 ).
Un cas évident où l'intervalle de confiance et l'intervalle crédible ne coïncident pas est illustré ici ( https://stats.stackexchange.com/a/369909/164061 ). L'intervalle de confiance pour ce cas peut avoir une ou même les deux limites (supérieure / inférieure) à l'infini.
la source
Ce n'est généralement pas vrai, mais cela peut sembler le cas en raison des cas spéciaux les plus fréquemment considérés.
La technique de conditionnement de Fisher sur une statistique auxiliaire donne dans ce cas un intervalle de confiance qui coïncide avec cet intervalle crédible.
la source
D'après ma lecture, j'ai pensé que cette affirmation est vraie de manière asymptotique, c'est-à-dire pour un échantillon de grande taille, et si l'on utilise un préalable non informatif.
Un simple exemple numérique semblerait le confirmer - les intervalles de probabilité maximale de profil à 90% et les intervalles crédibles à 90% d'un GLM binomial ML et d'un GLM binomial bayésien sont en effet pratiquement identiques pour
n=1000
, bien que l'écart devienne plus grand pour les petitsn
:Comme vous pouvez le voir, dans l'exemple ci-dessus, pour
n=1000
, les intervalles de confiance du profil à 90% d'un GLM binomial sont pratiquement identiques aux intervalles crédibles à 90% d'un GLM binomial bayésien (la différence est également dans les limites de l'utilisation de graines différentes et différentes nombre d'itérations dans les ajustements bayésiens, et une équivalence exacte ne peut pas non plus être obtenue car la spécification d'un a priori non informatif à 100% n'est également pas possible avecrstanarm
oubrms
).la source