concernant l'indépendance conditionnelle et sa représentation graphique

10

En étudiant la sélection de covariance, j'ai lu une fois l'exemple suivant. En ce qui concerne le modèle suivant:

entrez la description de l'image ici

Sa matrice de covariance et sa matrice de covariance inverse sont données comme suit,

entrez la description de l'image ici

Je ne comprends pas pourquoi l'indépendance de et est décidée par la covariance inverse ici?xy

Quelle est la logique mathématique qui sous-tend cette relation?

En outre, le graphique de gauche dans la figure suivante est censé capturer la relation d'indépendance entre et ; Pourquoi?xy

entrez la description de l'image ici

bit-question
la source

Réponses:

11

La matrice de covariance inverse peut être utilisée pour déterminer les variances et covariances conditionnelles pour les distributions gaussiennes multivariées. Une question antérieure donne quelques références

Par exemple, pour trouver la covariance conditionnelle de et étant donné la valeur , vous prendriez le coin inférieur droit de la matrice de covariance inverseYZX=x

(1113) and re-invert it to (32121212)

ce qui donne en effet la matrice de covariance de et conditionnée à la valeur de .YZX=x

De la même manière, pour trouver la matrice de covariance conditionnelle de et étant donné la valeur de , vous prendriez le coin supérieur gauche de la matrice de covariance inverseXYZ=z

(1001) and re-invert it to (1001)

vous indiquant que la covariance conditionnelle entre et étant donné que est (et que chacune de leurs variances conditionnelles est ). XYZ=z01

Pour conclure que cette covariance conditionnelle nulle implique l'indépendance conditionnelle, vous devez également utiliser le fait qu'il s'agit d'une gaussienne multivariée (car en général la covariance nulle n'implique pas nécessairement l'indépendance). Vous le savez depuis la construction.

On peut dire que vous connaissez également l'indépendance conditionnelle de la construction, car on vous dit que et sont iid, donc conditionnés à une valeur particulière pour , et sont également iid . Si vous connaissez , il n'y a aucune information supplémentaire de qui vous permet de dire quoi que ce soit sur les valeurs possibles de .ϵ1ϵ2Z=zX=z+ϵ1Y=z+ϵ2Z=zXY

Henri
la source
0

Ceci est un complément à la réponse correcte et acceptée. En particulier, la question d'origine contient une question complémentaire sur la déclaration du livre.

En outre, le graphique de gauche dans la figure suivante est censé capturer la relation d'indépendance entre et , pourquoi? XYentrez la description de l'image ici

C'est ce qui est abordé dans cette réponse, et c'est la seule chose abordée dans cette réponse.

Pour nous assurer que nous sommes sur la même page, dans ce qui suit, j'utilise cette définition de graphe d'indépendance conditionnelle (non orienté) qui correspond (au moins grossièrement) aux champs aléatoires de Markov:

Définition: Le graphe d'indépendance conditionnelle de est le graphe non orienté où et n'est pas dans le jeu de bords si et seulement si . (Où désigne le vecteur de toutes les variables aléatoires à l'exception de et .)XG=(K,E)K={1,2,,k}(i,j) X K { i , j } X i X jXiXj|XK{i,j}XK{i,j}XiXj

De la p. 60 de Whittaker, Graphical Models in Applied Mathematical Multivariate Statistics (1990).

Ici, en utilisant l'argument donné par Henry dans la bonne réponse acceptée, nous pouvons établir que et sont conditionnellement indépendants étant donné , en notation, .Y Z X XYZXY |Z

Étant donné que les trois seules variables aléatoires sont et , cela signifie que et sont conditionnellement indépendants lorsqu'ils reçoivent toutes les autres variables aléatoires restantes (dans ce cas, juste ).Z X Y ZX,YZXYZ

En utilisant la définition du graphe d'indépendance conditionnelle donnée ci - dessus, cela signifie que tous les bords du graphique doivent être inclus à l' exception du bord entre et . En effet, c'est exactement ce qui est montré sur le graphique de droite de cette image.YXY

En ce qui concerne le graphique de gauche, il n'est pas clair sans avoir plus de contexte, mais je pense que l'idée est simplement de montrer à quoi ressemblerait le graphique d'indépendance conditionnelle si nous n'avions pas de zéros dans ces entrées de la matrice de covariance inverse.

En particulier, en utilisant la définition ci-dessus, nous voyons que nous pouvons commencer avec le graphique complet sur les nœuds , qui est le graphique de gauche dans cette image, puis dériver le graphique d'indépendance conditionnelle de ce premier graphique en supprimant tous arêtes correspondant à des variables aléatoires conditionnellement indépendantes. L'image compare les deux graphiques de manière explicite ("versus"), ce qui me suggère une comparaison entre le graphique complet avec lequel on pourrait commencer et le graphique d'indépendance conditionnelle avec lequel on se retrouve si / quand ils appliquent la définition du graphique d'indépendance conditionnelle telle que donnée au dessus de.X,Y,Z

Chill2Macht
la source