Problème
J'écris une fonction R qui effectue une analyse bayésienne pour estimer une densité postérieure à partir d'un préalable informé et de données. Je voudrais que la fonction envoie un avertissement si l'utilisateur doit reconsidérer le préalable.
Dans cette question, je suis intéressé à apprendre à évaluer un a priori. Les questions précédentes ont couvert la mécanique de l'énonciation de prieurs informés ( ici et ici .)
Les cas suivants peuvent nécessiter une réévaluation du préalable:
- les données représentent un cas extrême qui n'a pas été pris en compte lors de la
- erreurs dans les données (par exemple, si les données sont en unités de g lorsque l'a priori est en kg)
- le mauvais avant a été choisi parmi un ensemble de prieurs disponibles en raison d'un bogue dans le code
Dans le premier cas, les antérieurs sont généralement suffisamment diffusés pour que les données les submergent généralement à moins que les valeurs des données ne se situent dans une plage non prise en charge (par exemple <0 pour logN ou Gamma). Les autres cas sont des bugs ou des erreurs.
Des questions
- Y a-t-il des problèmes concernant la validité de l'utilisation des données pour évaluer un a priori?
- un test particulier est-il le mieux adapté à ce problème?
Exemples
Voici deux ensembles de données qui sont mal appariés à un antérieur parce qu'ils proviennent de populations avec (rouge) ou (bleu).
Les données bleues pourraient être une combinaison prioritaire + données valide tandis que les données rouges nécessiteraient une distribution préalable prise en charge pour les valeurs négatives.
set.seed(1)
x<- seq(0.01,15,by=0.1)
plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')
la source
Voici mes deux cents:
Je pense que vous devriez vous préoccuper des paramètres antérieurs associés aux ratios.
Vous parlez de priorité informative, mais je pense que vous devriez avertir les utilisateurs de ce qu'est une priorité non informative raisonnable. Je veux dire, parfois une normale avec une moyenne nulle et une variance de 100 est assez peu informative et parfois elle est informative, selon les échelles utilisées. Par exemple, si vous régressez les salaires sur des hauteurs (centimètres), ce qui précède est assez informatif. Cependant, si vous régressez les salaires des journaux sur des hauteurs (mètres), le précédent ci-dessus n'est pas si informatif.
Si vous utilisez un a priori qui est le résultat d'une analyse précédente, c'est-à-dire que le nouveau a priori est en fait un ancien postérieur d'une analyse précédente, alors les choses sont différentes. Je suppose que c'est noter le cas.
la source