Dans le cadre de la reproduction d'un modèle que j'ai décrit partiellement dans cette question sur Stack Overflow, je souhaite obtenir un tracé d'une distribution postérieure. Le modèle (spatial) décrit le prix de vente de certaines propriétés comme une distribution de Bernoulli selon que la propriété est chère (1) ou bon marché (0). Dans les équations:
où est le résultat binaire 1 ou 0, est la probabilité d'être bon marché ou cher, est une variable spatiale aléatoire où représente sa position . Tout cela pour chaque car il y a 70 propriétés dans l'ensemble de données. est une matrice de covariance basée sur la position géographique des points de données. Si vous êtes curieux de connaître ce modèle, l'ensemble de données peut être trouvé ici .
Le tracé que je veux obtenir est le tracé de contour suivant:
La figure est décrite comme "Tracé d'image de la surface médiane postérieure du processus latent , modèle spatial binaire ". Le livre dit aussi ceci:
La figure 5.8 montre le tracé de l'image avec des lignes de contour superposées pour la surface moyenne postérieure de la latente processus.
Cependant, il n'y a que 70 paires de points dans l'ensemble de données. Je suppose que, pour produire un tracé de contour, je dois estimeren 70 * 70 points. Donc, ma question est: comment puis-je produire cette surface médiane postérieure? Jusqu'à présent, j'ai des échantillons de distributions postérieures pour tous les paramètres impliqués (en utilisant PyMC) et je sais que je peux prédireà un nouveau point en utilisant la distribution prédictive postérieure. Cependant, je ne sais pas prédire les valeurs à un nouveau point . Peut-être que je me trompe et l'intrigue n'a pas été construite par prédiction mais par interpolation.
MISE À JOUR :
Tout d'abord, c'est la médiane de la distribution postérieure de à chaque endroit où il y a une propriété. Ceci est basé sur la trace MCMC pour.
Et voici l'interpolation (avec un tracé de contour) en utilisant une fonction de base radiale:
(Si vous êtes intéressé par le code, faites le moi savoir)
Comme vous pouvez le voir, il existe des différences importantes dans les parcelles. Quelques questions:
Comment savoir si ces différences s'expliquent par la procédure d'interpolation?
Peut-être, il existe des variations importantes dans la distribution postérieure de que j'ai calculé et celui montré dans le livre. Quelle variation est acceptable entre les simulations MCMC? Même mes propres paramètres changent un peu en fonction de l'échantillonnage que j'utilise (Metropolis, Metropolis Adaptive.)
Existe-t-il une procédure bayésienne pour prédire les points afin de générer un tracé de contour comme je l'ai fait en utilisant la fonction de base radiale?
la source
Réponses:
Il est très probable que l'auteur ait utilisé un processus gaussien pour produire l'interpolation. Je pense que c'est vrai parce qu'un exercice dans le livre décrit un problème très similaire à celui-ci et nécessite une intrigue basée sur un processus gaussien.
Je l'ai essayé et je pense que l'intrigue résultante partage des caractéristiques avec la surface médiane postérieure de la question d'origine. Il s'agit de la médiane de la distribution postérieure dew ( s ) comme ci-dessus (c'est légèrement différent parce que j'ai exécuté une autre simulation MCMC):
Et voici l'interpolation basée sur un processus gaussien:
Comme vous pouvez le voir, la méthode d'interpolation fait une énorme différence.
la source