Que se passe-t-il lorsque vous n'avez aucune idée de la distribution des paramètres? Quelle approche devrions-nous utiliser?
La plupart du temps, nous visons à sous-estimer si une certaine variable a une influence sur la présence / absence d'une certaine espèce, et si la variable est acceptée ou non selon l'importance de la variable. Cela signifie que la plupart du temps, nous ne pensons pas à la distribution expetcted qu'un paramètre devrait avoir.
Est-il correct de supposer que tous les paramètres suivent une distribution normale, alors que tout ce que je sais, c'est que b1, b2, b3 et b4 devraient varier entre -2 et 2, et b0 peut varier entre -5 et 5?
model {
# N observations
for (i in 1:N) {
species[i] ~ dbern(p[i])
logit(p[i]) <- b0 + b1*var1[i] + b2*var2[i] +
b3*var3[i] + b4*var4[i]
}
# Priors
b0 ~ dnorm(0,10)
b1 ~ dnorm(0,10)
b2 ~ dnorm(0,10)
b3 ~ dnorm(0,10)
b4 ~ dnorm(0,10)
}
Réponses:
Les paramètres du prédicteur linéaire sont distribués en t . Lorsque le nombre d'enregistrements atteint l'infini, il converge vers une distribution normale. Donc oui, normalement, il est considéré comme correct de supposer une distribution normale des paramètres.
Quoi qu'il en soit, dans les statistiques bayésiennes, vous n'avez pas besoin de supposer la distribution des paramètres. Normalement, vous spécifiez des soi-disant prieurs non informatifs . Pour chaque cas, différents prieurs non informatifs sont recommandés. Dans ce cas, les gens utilisent souvent quelque chose comme (vous pouvez bien sûr ajuster les valeurs):
ou
La seconde est préférée, car elle n'est pas limitée à des valeurs particulières. Avec des prieurs non informatifs, vous n'avez pris aucun risque. Vous pouvez bien sûr les limiter à un intervalle particulier, mais soyez prudent.
Donc, vous spécifiez avant non informatif et la distribution des paramètres sortira d'elle-même! Pas besoin de faire d'hypothèses à ce sujet.
la source
dnorm(0, 1/10^10)
ou autreMalheureusement, des prieurs apparents inoffensifs peuvent être très dangereux (et ont même trompé certains Bayésiens chevronnés).
Cet article récent fournit une belle introduction ainsi que des méthodes de traçage pour visualiser le antérieur et le postérieur (généralement des prieurs / postérieurs marginaux pour le (s) paramètre (s) d'intérêt).
Dangers cachés de la spécification de prieurs non informatifs. John W. Seaman III, John W. Seaman Jr. & James D. Stamey The American Statistician Volume 66, numéro 2, mai 2012, pages 77-84. http://amstat.tandfonline.com/doi/full/10.1080/00031305.2012.695938
De tels complots à mon avis devraient être obligatoires dans toute analyse bayésienne réelle, même si l'analyste n'en a pas besoin - ce qui se passe dans une analyse bayésienne devrait être clair pour la plupart des lecteurs.
la source
L'analyse de sensibilité est généralement une bonne façon de procéder: essayez différents priors et voyez comment vos résultats changent avec eux. S'ils sont robustes, vous serez probablement en mesure de convaincre de nombreuses personnes de vos résultats. Sinon, vous voudrez probablement quantifier en quelque sorte comment les prieurs changent les résultats.
la source