Pourquoi ne pas utiliser Beta (1,1) comme limite évitant a priori sur un paramètre de corrélation transformé?

8

Dans Bayesian Data Analysis , chapitre 13, page 317, deuxième paragraphe complet, dans les approximations modales et distributionnelles, Gelman et al. écrire:

Si le plan est de résumer l'inférence par le mode postérieur de [le paramètre de corrélation dans une distribution normale bivariée], nous remplacerions la distribution précédente U (-1,1) par p (\ rho) \ propto (1 - \ rho) (1 + \ rho) , ce qui équivaut à une Bêta (2,2) sur le paramètre transformé \ frac {\ rho + 1} {2} . Les densités a priori et résultantes sont nulles aux frontières et donc le mode postérieur ne sera jamais -1 ou 1. Cependant, ... la densité a priori pour \ rho est linéaire près des frontières et ne contredira donc aucune vraisemblance.ρp(ρ)(1ρ)(1+ρ)ρ+12ρ

Vous trouverez ci-dessous un tracé du PDF pour la distribution bêta (2,2).

Tracé PDF de la bêta (2,2)

Bien que le tracé soit donné pour le domaine [0,1], la forme est la même pour le domaine [-1,1] obtenue en effectuant l'inverse de la transformation décrite dans la citation ci-dessus. Il s'agit d'une distribution assez informative! Il donne environ sept fois la densité de par rapport à . Donc , en fait , il serait en contradiction avec la probabilité si la probabilité pointée vers quelque chose loin des frontières, mais encore plus de . Une meilleure frontière évitant la précédente ne serait-elle pas Bêta (1 + , 1 + ), où . Prenons, par exemple, la version bêta (1.0001, 1.0001), tracée ci-dessous:ρ+12=0.5ρ+12=0.3,0.97ρ=0δδδ0

Tracé PDF de la bêta (1.0001,1.0001)

Le problème avec cet a priori, bien sûr, est que la densité chute très fortement près de zéro, ce qui peut contredire la probabilité qu'elle pointe vers un espace qui est très très près d'une frontière. Ce qui m'amène à ma question:

Pourquoi ne pas simplement définir la priorité du paramètre de corrélation transformé sur Bêta (1,1)? Étant donné que la densité de distribution bêta est nulle pour , cela équivaut à la distribution uniforme sur l' intervalle ouvert (-1,1) plutôt que sur l'intervalle fermé [-1, 1], et n'est-ce donc pas une frontière qui évite un a priori, et n'est-il pas préférable à un a priori qui croit assez fortement en la probabilité que , ce qui n'est souhaitable que si vous avez réellement cette croyance?ρ+12=0,1ρ=0

Plus généralement, l'utilisation de la distribution bêta par définition n'est-elle pas une limite à éviter avant car son support est ?0<ρ+12<1

Équilibre des sarrasins
la source

Réponses:

2

Dans les cas où la fonction de vraisemblance est maximisée à , l'utilisation de Beta (1,1) sur un intervalle ouvert n'aide pas car il n'y a pas de mode postérieur bien défini. Il n'y a aucun point dans l'intervalle ouvert que vous pourriez dire est le mode postérieur. ρ=1

Le livre veut que l'avant soit linéaire aux limites, ce qui sélectionne uniquement Beta (2,2) parmi toutes les distributions Beta. Mais le livre n'explique jamais précisément pourquoi la linéarité est si importante.

Tom Minka
la source
Et il ne discute jamais des effets secondaires que je décris dans la question! J'ai voté pour votre réponse, mais je ne l'ai pas encore vérifiée comme définitive. Et j'avais renoncé à ce Q!
Brash Equilibrium