Winbugs et autres MCMC sans information pour distribution préalable

10

Que se passe-t-il lorsque vous n'avez aucune idée de la distribution des paramètres? Quelle approche devrions-nous utiliser?

La plupart du temps, nous visons à sous-estimer si une certaine variable a une influence sur la présence / absence d'une certaine espèce, et si la variable est acceptée ou non selon l'importance de la variable. Cela signifie que la plupart du temps, nous ne pensons pas à la distribution expetcted qu'un paramètre devrait avoir.

Est-il correct de supposer que tous les paramètres suivent une distribution normale, alors que tout ce que je sais, c'est que b1, b2, b3 et b4 devraient varier entre -2 et 2, et b0 peut varier entre -5 et 5?

model {
    # N observations
    for (i in 1:N) {
        species[i] ~ dbern(p[i])
        logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] + 
            b3*var3[i] + b4*var4[i]
    }
    # Priors
    b0     ~ dnorm(0,10)
    b1   ~ dnorm(0,10)
    b2 ~ dnorm(0,10)
    b3  ~ dnorm(0,10)
    b4  ~ dnorm(0,10)
}
Gago-Silva
la source
Si vous n'avez pas d'antécédent, vous ne pouvez pas utiliser l'inférence bayésienne. Et donc la méthodologie MCMC,
Xi'an

Réponses:

6

Les paramètres du prédicteur linéaire sont distribués en t . Lorsque le nombre d'enregistrements atteint l'infini, il converge vers une distribution normale. Donc oui, normalement, il est considéré comme correct de supposer une distribution normale des paramètres.

Quoi qu'il en soit, dans les statistiques bayésiennes, vous n'avez pas besoin de supposer la distribution des paramètres. Normalement, vous spécifiez des soi-disant prieurs non informatifs . Pour chaque cas, différents prieurs non informatifs sont recommandés. Dans ce cas, les gens utilisent souvent quelque chose comme (vous pouvez bien sûr ajuster les valeurs):

dunif(-100000, 100000)

ou

dnorm(0, 1/10^10)

La seconde est préférée, car elle n'est pas limitée à des valeurs particulières. Avec des prieurs non informatifs, vous n'avez pris aucun risque. Vous pouvez bien sûr les limiter à un intervalle particulier, mais soyez prudent.

Donc, vous spécifiez avant non informatif et la distribution des paramètres sortira d'elle-même! Pas besoin de faire d'hypothèses à ce sujet.

Curieuse
la source
1
Malheureusement, ce n'est pas tout à fait vrai: les limites de l'uniforme ci-dessus peuvent influencer le résultat, en particulier. lors du test d'hypothèses. C'est à mon avis un inconvénient de Winbugs.
Xi'an
@ Xi'an - bien sûr, c'est ce que je dis. C'est pourquoi je préfère le "flat normal" dans ce cas - c'est-à-dire la deuxième option. Peut-être avec peaufinage du deuxième paramètre.
Curieux
1
Hmmm, ce n'est pas du tout un plat avant ...
Xi'an
Vous êtes libre d'utiliser dnorm(0, 1/10^10)ou autre
Curious
8

Malheureusement, des prieurs apparents inoffensifs peuvent être très dangereux (et ont même trompé certains Bayésiens chevronnés).

Cet article récent fournit une belle introduction ainsi que des méthodes de traçage pour visualiser le antérieur et le postérieur (généralement des prieurs / postérieurs marginaux pour le (s) paramètre (s) d'intérêt).

Dangers cachés de la spécification de prieurs non informatifs. John W. Seaman III, John W. Seaman Jr. & James D. Stamey The American Statistician Volume 66, numéro 2, mai 2012, pages 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938

De tels complots à mon avis devraient être obligatoires dans toute analyse bayésienne réelle, même si l'analyste n'en a pas besoin - ce qui se passe dans une analyse bayésienne devrait être clair pour la plupart des lecteurs.

phaneron
la source
2
bon lien, c'est dommage qu'il ne soit pas disponible gratuitement.
Curieux
6

L'analyse de sensibilité est généralement une bonne façon de procéder: essayez différents priors et voyez comment vos résultats changent avec eux. S'ils sont robustes, vous serez probablement en mesure de convaincre de nombreuses personnes de vos résultats. Sinon, vous voudrez probablement quantifier en quelque sorte comment les prieurs changent les résultats.

la démence
la source