J'ai entendu dire que l'on pouvait trouver des corrélations partielles entre des variables aléatoires en inversant la matrice de covariance et en prenant les cellules appropriées à partir de cette matrice de précision résultante (ce fait est mentionné dans http://en.wikipedia.org/wiki/Partial_correlation , mais sans preuve). .
pourquoi est-ce le cas?
Réponses:
Quand une variable aléatoire multivariée a une matrice de covariance non dégénérée C = ( γ i j ) = ( Cov ( X i , X j ) ) , l’ensemble de toutes les combinaisons linéaires réelles des X i forme un espace vectoriel réel de dimension n avec la base E = ( X 1 , X 2 , … ,( X1, X2, … , Xn) C =( γje j) = ( Cov ( Xje, Xj) ) Xi n et un produit interne non dégénéré donné parE=(X1,X2,…,Xn)
Sa base double par rapport à ce produit scalaire , , est défini de manière unique par les relationsE∗=(X∗1,X∗2,…,X∗n)
le delta de Kronecker (égal à lorsque i = j et à 0 sinon).1 i=j 0
La double base est intéressante ici parce que la corrélation partielle de et X j est obtenue en tant que corrélation entre la partie de X i qui est laissée après l'avoir projetée dans l'espace parcouru par tous les autres vecteurs (appelons simplement cela " résiduel ", X i ∘ ) et la partie comparable de X j , son résidu X j ∘ . Pourtant, X ∗ i est un vecteur orthogonal à tous les vecteurs autres que X i et a un produit interne positif avec X i d' où X iXi Xj Xi Xi∘ Xj Xj∘ X∗i Xi Xi doit être un multiple non négatif de X * i , etmême pour X j . Laissez-nous donc écrireXi∘ X∗i Xj
pour les nombres réels positifs et λ j .λi λj
La corrélation partielle est le produit scalaire normalisé des résidus, qui reste inchangé par le rééchelonnement:
(Dans les deux cas, la corrélation partielle sera égale à zéro chaque fois que les résidus sont orthogonaux, qu'ils soient non nuls ou non.)
Nous devons trouver les produits intérieurs des éléments de base doubles. À cette fin, développez les éléments de base doubles par rapport à la base d'origine :E
Puis par définition
En notation matricielle avec la matrice identité et B = ( β i j ) la matrice de changement de base, cela indiqueI=(δij) B=(βij)
C’est-à-dire que correspond exactement à ce que dit l’article de Wikipedia. La formule précédente pour la corrélation partielle donneB=C−1
la source
Voici une preuve avec juste des calculs matriciels.
J'apprécie la réponse de Whuber. C'est très perspicace sur le calcul derrière la scène. Cependant, comment utiliser sa réponse pour obtenir le signe moins dans la formule indiquée dans wikipedia Partial_correlation # Using_matrix_inversion n’est toujours pas si trivial .
Pour obtenir ce signe moins, voici une preuve différente trouvée dans «Graphical Models Lauriten 1995 Page 130». Cela se fait simplement par des calculs matriciels.
Soit . De même, écrivez P comme P = ( P 11 P 12 P 21 P 22 )P=Ω−1 P
Par l'identité de la matrice de clés,
la source
i=j
, alorsrho_ii V\{X_i, X_i} = -1
, comment interprétons-nous ces éléments diagonaux dans la matrice de précision?Cela explique la confusion dans les commentaires ci-dessus, ainsi que sur Wikipedia. La deuxième définition est utilisée universellement d'après ce que je peux dire, il devrait donc y avoir un signe négatif.
J'ai initialement posté une modification sur l'autre réponse, mais j'ai commis une erreur - désolée pour ça!
la source