Tracer une «surface médiane postérieure»

8

Dans le cadre de la reproduction d'un modèle que j'ai décrit partiellement dans cette question sur Stack Overflow, je souhaite obtenir un tracé d'une distribution postérieure. Le modèle (spatial) décrit le prix de vente de certaines propriétés comme une distribution de Bernoulli selon que la propriété est chère (1) ou bon marché (0). Dans les équations:

yjeBernoulli(pje)
pjelogit-1(b0+b1Salon/1000+b2Âge+w(s))
w(s)MVN(0,Σ)

où est le résultat binaire 1 ou 0, est la probabilité d'être bon marché ou cher, est une variable spatiale aléatoire où représente sa position . Tout cela pour chaque car il y a 70 propriétés dans l'ensemble de données. est une matrice de covariance basée sur la position géographique des points de données. Si vous êtes curieux de connaître ce modèle, l'ensemble de données peut être trouvé ici .yjepjew(s)sje={1,...,70}Σ

Le tracé que je veux obtenir est le tracé de contour suivant:

entrez la description de l'image ici

La figure est décrite comme "Tracé d'image de la surface médiane postérieure du processus latent w(s), modèle spatial binaire ". Le livre dit aussi ceci:

La figure 5.8 montre le tracé de l'image avec des lignes de contour superposées pour la surface moyenne postérieure de la latente w(s) processus.

Cependant, il n'y a que 70 paires de points dans l'ensemble de données. Je suppose que, pour produire un tracé de contour, je dois estimerw(s)en 70 * 70 points. Donc, ma question est: comment puis-je produire cette surface médiane postérieure? Jusqu'à présent, j'ai des échantillons de distributions postérieures pour tous les paramètres impliqués (en utilisant PyMC) et je sais que je peux prédireyà un nouveau point en utilisant la distribution prédictive postérieure. Cependant, je ne sais pas prédire les valeursw(s) à un nouveau point s. Peut-être que je me trompe et l'intrigue n'a pas été construite par prédiction mais par interpolation.

MISE À JOUR :

Tout d'abord, c'est la médiane de la distribution postérieure de w(s)à chaque endroit où il y a une propriété. Ceci est basé sur la trace MCMC pourw.

entrez la description de l'image ici

Et voici l'interpolation (avec un tracé de contour) en utilisant une fonction de base radiale:

entrez la description de l'image ici

(Si vous êtes intéressé par le code, faites le moi savoir)

Comme vous pouvez le voir, il existe des différences importantes dans les parcelles. Quelques questions:

  1. Comment savoir si ces différences s'expliquent par la procédure d'interpolation?

  2. Peut-être, il existe des variations importantes dans la distribution postérieure de w(s)que j'ai calculé et celui montré dans le livre. Quelle variation est acceptable entre les simulations MCMC? Même mes propres paramètres changent un peu en fonction de l'échantillonnage que j'utilise (Metropolis, Metropolis Adaptive.)

  3. Existe-t-il une procédure bayésienne pour prédire les points w(s) afin de générer un tracé de contour comme je l'ai fait en utilisant la fonction de base radiale?

Robert Smith
la source
1
L'interpolation est une prédiction! (Parce quew est un processus, avec une valeur de wà n'importe quel endroit non observé revient à deviner la valeur d'une variable aléatoire. La prédiction, par définition, consiste à deviner la valeur d'une variable aléatoire.)
whuber
Sûr. Je voulais dire l'interpolation par opposition à la prédiction bayésienne. Au fait, j'ai essayé d'utiliser l'interpolation avec le plus proche voisin et j'ai obtenu des résultats horribles.
Robert Smith
Vous devriez probablement obtenir des résultats terribles si vous utilisez les données brutes dans un programme d'interpolation, car cela résolvait un problème différent. Vous voulez un tracé de contour uniquement de law terme, mais le programme utilisait (je présume) le yje.
whuber
Non, j'utilisais la médiane de la distribution postérieure pour chaque w(s).
Robert Smith,
À quels emplacements spatiaux savez-vous calculé la médiane de la distribution postérieure? Je crois que la principale motivation derrière un modèle de ce type est de suivre la distribution desw(s)à tous les points où vous souhaitez prédire ses valeurs, qui - dans le cas de cette carte de contour - seraient les 4900 nœuds de la grille.
whuber

Réponses:

1

Il est très probable que l'auteur ait utilisé un processus gaussien pour produire l'interpolation. Je pense que c'est vrai parce qu'un exercice dans le livre décrit un problème très similaire à celui-ci et nécessite une intrigue basée sur un processus gaussien.

Je l'ai essayé et je pense que l'intrigue résultante partage des caractéristiques avec la surface médiane postérieure de la question d'origine. Il s'agit de la médiane de la distribution postérieure dew(s) comme ci-dessus (c'est légèrement différent parce que j'ai exécuté une autre simulation MCMC):

entrez la description de l'image ici

Et voici l'interpolation basée sur un processus gaussien:

entrez la description de l'image ici

Comme vous pouvez le voir, la méthode d'interpolation fait une énorme différence.

Robert Smith
la source