Modélisation bayésienne utilisant la normale multivariée avec la covariable

11

Supposons que vous ayez une variable explicative où représente une coordonnée donnée. Vous avez également une variable de réponse . Maintenant, nous pouvons combiner les deux variables comme:X=(X(s1),,X(sn))sY=(Y(s1),,Y(sn))

W(s)=(X(s)Y(s))N(μ(s),T)

Dans ce cas, nous choisissons simplement μ(s)=(μ1μ2)T et T est une matrice de covariance qui décrit la relation entre X et Y . Cela ne décrit que la valeur de X et Y à s . Puisque nous avons plus de points provenant d'autres emplacements pour X et Y , nous pouvons décrire plus de valeurs de W(s) de la manière suivante:

(XY)=N((μ11μ21),TH(ϕ))

Vous remarquerez que nous avons réorganisé les composants de X et Y pour obtenir tous les X(si) dans une colonne et après cela, concaténer tous les Y(si) ensemble. Chaque composant H(ϕ)ij est une fonction de corrélation ρ(si,sj) et T est comme ci-dessus. La raison pour laquelle nous avons la covariance TH(ϕ) est parce que l' on suppose qu'il est possible de séparer la matrice de covariance comme C(s,s)=ρ(s,s)T .

Question 1: Lorsque je calcule le YX , ce que je fais en fait, c'est de générer un ensemble de valeurs de Y basé sur X , correct? J'ai déjà Y donc je serais plus intéressé à prédire un nouveau point y(s0) . Dans ce cas, je devrais avoir une matrice H(ϕ) définie comme

H(ϕ)=(H(ϕ)hhρ(0,ϕ))

dans lequel h(ϕ) est un vecteur ρ(s0sj;ϕ) . Par conséquent, nous pouvons construire un vecteur (sans réarrangement):

W=(W(s1),,W(sn),W(s0))TN(1n+1(μ1μ2),H(ϕ)T)

Et maintenant je viens de réorganiser pour obtenir une distribution conjointe et obtenir le conditionnel .p(y(s0)x0,X,Y)(Xx(s0)Yy(s0))p(y(s0)x0,X,Y)

Est-ce correct?

Question 2: Pour prédire, l'article que je lis indique que je dois utiliser cette distribution conditionnelle et obtenir une postérieure distribution , mais je ne sais pas comment obtenir la distribution postérieure des paramètres. Je pourrais peut-être utiliser la distribution que je pense est exactement le même que , puis utilisez simplement le théorème de Bayes pour obtenirp ( μ , T , ϕ x ( s 0 ) , Y , X ) ( X x ( s 0 ) Y ) p ( X , x ( s 0 ) , Yμ , T , ϕ ) pp(y(s0)x0,X,Y)p(μ,T,ϕx(s0),Y,X)(Xx(s0)Y)p(X,x(s0),Yμ,T,ϕ)p(μ,T,ϕX,x(s0),Y)p(X,x(s0),Yμ,T,ϕ)p(μ,T,ϕ)

Question 3: À la fin du sous-chapitre, l'auteur dit ceci:

Pour la prédiction, nous n'avons pas . Cela ne crée pas de nouveaux problèmes car il peut être traité comme une variable latente et incorporé dans Cela ne fait que générer un tirage supplémentaire dans chaque itération de Gibbs et est un ajout trivial à la tâche de calcul. xX(s0)x

Que signifie ce paragraphe?

Soit dit en passant, cette procédure se trouve dans cet article (page 8), mais comme vous pouvez le voir, j'ai besoin d'un peu plus de détails.

Merci!

Robert Smith
la source
A voté pour migrer par demande OP .
Je dirais que vos réponses aux questions 1 et 2 sont correctes . La question 3 signifie que le non observé est traité comme un paramètre supplémentaire, en plus de , en utilisant le conditionnel complet comme précédemment sur . μ , T , φ p ( x ( s 0 ) | X , , Y , μ , T , φ ) X ( s 0 )X(s0)μ,T,ϕ
p(x(s0)X,,Y,μ,T,ϕ)
X(s0)
Xi'an

Réponses:

2

Question 1: Étant donné votre modèle de probabilité conjoint la distribution conditionnelle de étant donné est également normal, avec une moyenne et matrice de variance-covariance Y X μ 2 + Σ 21 Σ - 1 11 ( X - μ

(XY)N((μ11μ21),[Σ11Σ12Σ21Σ22])=N((μ11μ21),TH(ϕ))
YX Σ 22 - Σ 21 Σ - 1 11 Σ 21 .
μ2+Σ21Σ111(Xμ1)
Σ22Σ21Σ111Σ21.
(Ces formules sont copiées textuellement à partir de la page Wikipedia sur les normales multivariées .) Il en va de même pour puisque est un autre vecteur normal.p(y(s0)x(s0),X,Y)(y(s0),x(s0),X,Y)

Question 2: Le prédictif est défini comme c'est-à-dire en intégrant les paramètres en utilisant la distribution postérieure de ces postérieurs, étant donné les données actuelles . Il y a donc un peu plus dans la réponse complète. Évidemment, si vous avez seulement besoin de simuler à partir du prédictif, votre notion de simulation conjointe à partir de puis à partir de est valide.p(y(s0)x(s0),X,Y)

p(y(s0)|x(s0),X,Y)=p(y(s0)|x(s0),X,Y,μ,T,ϕ)p(μ,T,ϕ|x(s0),X,Y)dμdTdϕ,
(X,Y,x(s0))p(μ,T,ϕX,x(s0),Y)p(y(s0)x(s0),X,Y,μ,T,ϕ)

Question 3: Dans le cas où n'est pas observé, la paire peut être prédite à partir d'un autre prédicteur x(s0)(x(s0),y(s0))

p(x(s0),y(s0)X,Y)=p(x(s0),y(s0)X,Y,μ,T,ϕ)p(μ,T,ϕX,Y)dμdTdϕ.

Lors de la simulation à partir de ce prédictif, car il n'est pas disponible sous une forme gérable, un échantillonneur Gibbs peut être exécuté qui simule de manière itérative

  1. μX,Y,x(s0),y(s0),T,ϕ
  2. TX,Y,x(s0),y(s0),μ,ϕ
  3. ϕX,Y,x(s0),y(s0),T,μ
  4. x(s0)X,Y,y(s0),ϕ,T,μ
  5. y(s0)X,Y,x(s0),ϕ,T,μ

ou bien fusionner les étapes 4 et 5 en une seule étape

  • x(s0),y(s0)X,Y,ϕ,T,μ
Xi'an
la source