Choisir entre des versions bêta antérieures non informatives

17

Je suis à la recherche de priors non informatifs pour la distribution bêta pour travailler avec un processus binomial (Hit / Miss). Au début, j'ai pensé à utiliser α=1,β=1 qui génèrent un PDF uniforme, ou Jeffrey avant α=0.5,β=0.5 . Mais je recherche en fait des prieurs qui ont un effet minimum sur les résultats postérieurs, et j'ai ensuite pensé à utiliser un mauvais a priori de α=0,β=0 . Le problème ici est que ma distribution postérieure ne fonctionne que si j'ai au moins un hit et un miss. Pour surmonter cela, j'ai alors pensé à utiliser une très petite constante, comme , juste pour s'assurer que α et β postérieursseront > 0 .α=0.0001,β=0.0001αβ>0

Est-ce que quelqu'un sait si cette approche est acceptable? Je vois des effets numériques de changer ces précédents, mais quelqu'un pourrait me donner une sorte d'interprétation de mettre de petites constantes comme celle-ci en tant que prieurs?

Mateus
la source
1
Pour les grands échantillons avec beaucoup de coups sûrs et manqués, cela fait peu de différence. Pour les petits échantillons, surtout s'il n'y a pas au moins un coup sûr et un coup manqué, cela fait une grande différence; même la taille de votre "très petite constante" peut avoir un impact substantiel. Je dirais que l'expérience de pensée clé pour vous pourrait être quel type de postérieur a du sens après un échantillon de : cela pourrait vous persuader que quelque chose comme le Jeffrey s prior est raisonnable1
Henry
Et il y a un papier Kerman suggérant 1/3 et 1/3, b
Björn
Qu'entendez-vous par «effet minimum sur les résultats postérieurs»? Comparé à quoi?
Will
J'ai amélioré la mise en forme et le titre de votre question, n'hésitez pas à revenir en arrière ou à modifier les modifications.
Tim

Réponses:

33

Tout d'abord, il n'y a rien de tel qu'un préalable non informatif . Ci-dessous, vous pouvez voir les distributions postérieures résultant de cinq priors "non informatifs" différents (décrits ci-dessous le graphique) étant donné des données différentes. Comme vous pouvez le voir clairement, le choix des prieurs "non informatifs" a affecté la distribution postérieure, en particulier dans les cas où les données elles-mêmes ne fournissaient pas beaucoup d'informations .

Postérieurs de prieurs non informatifs

α=βα1,β1α=β=1α=β=1/2α=β=1/3α=β=0α=β=εε>0

αβyn

θyB(α+y,β+ny)

α,βα=β=1n

A première vue, Haldane prior, semble être le plus "non informatif", car il conduit à la moyenne postérieure, qui est exactement égale à l'estimation du maximum de vraisemblance

α+yα+y+β+ny=y/n

y=0y=n

Il existe un certain nombre d'arguments pour et contre chacun des prieurs «non informatifs» (voir Kerman, 2011; Tuyl et al, 2008). Par exemple, comme discuté par Tuyl et al,

101

D'un autre côté, l'utilisation de priors uniformes pour de petits ensembles de données peut être très influente (pensez-y en termes de pseudocomptes). Vous pouvez trouver beaucoup plus d'informations et de discussions sur ce sujet dans plusieurs articles et manuels.

Désolé, mais il n'y a pas de prieurs «meilleurs», «les moins informatifs» ou «taille unique». Chacun d'eux apporte des informations dans le modèle.

Kerman, J. (2011). Distributions antérieures bêta et gamma conjuguées neutres non informatives et informatives. Journal électronique des statistiques, 5, 1450-1470.

Tuyl, F., Gerlach, R. et Mengersen, K. (2008). Une comparaison de Bayes-Laplace, Jeffreys et autres Prieurs. The American Statistician, 62 (1): 40-44.

Tim
la source