Un échantillon de matrice de covariance est-il toujours symétrique et positif défini?

33

Lors du calcul de la matrice de covariance d'un échantillon, est-il alors garanti d'obtenir une matrice symétrique et définie positive?

Actuellement, mon problème a un échantillon de 4600 vecteurs d'observation et 24 dimensions.

Morten
la source
Pour échantillonner la matrice de covariance, j’utilise la formule suivante: où est le nombre d'échantillons et est la moyenne de l'échantillon. Qn=1ni=1n(xix¯)(xix¯)nx¯
Morten
4
Ce serait normalement appelé «calcul de la matrice de covariance de l'échantillon» ou «estimation de la matrice de covariance» plutôt que «échantillonnage de la matrice de covariance».
Glen_b -Reinstate Monica
1
Une situation courante dans laquelle la matrice de covariance n'est pas définie est lorsque les 24 "dimensions" enregistrent la composition d'un mélange dont la somme est égale à 100%.
whuber

Réponses:

41

Pour un échantillon de vecteurs , avec , le vecteur moyen de l'échantillon est et l'exemple de matrice de covariance est Pour un vecteur non nul , nous avons Par conséquent, est toujours positif semi-défini .xi=(xi1,,xik)i=1,,n

x¯=1ni=1nxi,
Q=1ni=1n(xix¯)(xix¯).
yRk
yQy=y(1ni=1n(xix¯)(xix¯))y
=1ni=1ny(xix¯)(xix¯)y
=1ni=1n((xix¯)y)20.()
Q

La condition supplémentaire pour que soit positif et définitif a été donnée dans le commentaire ci-dessous. Cela va comme suit.Q

Définissez , pour . Pour tout non nul, , vaut zéro si et seulement si , pour chaque . Supposons que l'ensemble s'étend sur . Ensuite, il existe des nombres réels tels que . Mais nous avons alors , ce qui donne que , une contradiction. Par conséquent, si la portée de , alorszi=(xix¯)i=1,,nyRk()ziy=0i=1,,n{z1,,zn}Rkα1,,αny=α1z1++αnznyy=α1z1y++αnzny=0y=0ziRkQr a n k [ z 1 ... z n ] = kest positif défini . Cette condition est équivalente à .rank[z1zn]=k

Zen
la source
2
J'aime cette approche, mais je conseillerais certaines précautions: n'est pas nécessairement positif. Les conditions (nécessaires et suffisantes) pour qu'il en soit ainsi sont décrites dans mon commentaire à la réponse de Konstantin. Q
whuber
1
Puisque le rang de est inférieur ou égal à , la condition peut être simplifiée au rang égal à k. k[z1,z2,,zn]k
une offre ne peut pas refuser
13

Une matrice de covariance correcte est toujours symétrique et positive * semi * définie.

La covariance entre deux variables est définie comme .σ(x,y)=E[(xE(x))(yE(y))]

Cette équation ne change pas si vous changez les positions de et . Par conséquent, la matrice doit être symétrique.yxy

Il doit également être positif * semi- * défini car:

Vous pouvez toujours trouver une transformation de vos variables de manière à ce que la matrice de covariance devienne diagonale. Sur la diagonale, vous trouvez les variances de vos variables transformées nulles ou positives, il est facile de voir que cela rend la matrice transformée positive semi-définie. Cependant, comme la définition de la définition est invariante à la transformation, il en résulte que la matrice de covariance est semi-définie positive dans tout système de coordonnées choisi.

Lorsque vous estimez votre matrice de covariance (c'est-à-dire lorsque vous calculez votre covariance d'échantillon ) à l'aide de la formule que vous avez indiquée ci-dessus, il est évident que toujours être symétrique. Il doit également être positif semi-défini (je pense), car pour chaque échantillon, le pdf qui donne à chaque échantillon une probabilité égale a la covariance de l'échantillon comme covariance (veuillez vérifier cela), de sorte que tout ce qui est indiqué ci-dessus reste valable.

Konstantin Schubert
la source
1
PS: Je commence à penser que ce n'était pas votre question ...
Konstantin Schubert
Mais si vous voulez savoir si votre algorithme d'échantillonnage le garantit, vous devrez indiquer comment vous échantillonnez.
Konstantin Schubert
1
Morten, la symétrie est immédiate de la formule. Pour montrer la semi-définition, vous devez établir que pour tout vecteur . Mais est fois la somme de (où , d'où est la somme de = , qui est la longueur au carré du vecteur . Parce que et une somme de carrés ne peuvent jamais être négatifs, , QED . Cela montre aussi que précisément pour ces vecteursu Q n 1 / n v i v ' i Iv i = x i - ˉ x ) n u Q n u ' u ( v i v ' i ) u ' ( u v i ) ( u v i ) u v i n > 0 uuQnu0uQn1/nvivivi=xix¯)nuQnuu(vivi)u(uvi)(uvi)uvin>0u Q n u ' = 0 u v i u v i = 0 i Iv i u = 0 Q nuQnu0uQnu=0uqui sont orthogonaux à tous les ( ie , pour tout ). Lorsque span, alors et sont définis. viuvi=0iviu=0Qn
whuber
1
@ Morten L'invariance par transformation est assez claire si vous comprenez une multiplication matricielle de manière géométrique. Pensez à votre vecteur comme une flèche. Les nombres qui décrivent votre vecteur changent avec le système de coordonnées, mais la direction et la longueur de votre vecteur ne le sont pas. Maintenant, une multiplication avec une matrice signifie que vous modifiez la longueur et la direction de cette flèche, mais là encore, l'effet est géométriquement identique dans chaque système de coordonnées. Il en va de même avec un produit scalaire: il est défini géométriquement et Geometriy est invariant par transformation. Donc, votre équation a le même résultat dans tous les systèmes.
Konstantin Schubert
1
@Morten Lorsque vous pensez en coordonnées, l'argument est le suivant: Quand est votre matrice de transformation, alors: avec tant que vecteur de coordonnées transformé, , donc lorsque vous transformez chaque élément en l'équation , vous obtenez , ce qui équivaut à , et, étant donné que A est orthogonal, est la matrice des unités et nous obtenons à nouveau , ce qui signifie que l'équation transformée et l'équation non transformée ont le même scalaire que le résultat, de sorte que leur valeur correspond à zéro ou à l'un ou l'autre. v ' = A v v ' M ' = A M A T V T M v > 0 v ' T M ' v ' = ( A v ) T A M A T A v > 0 v T A T A M A T A v > 0 A T A v T M vAv=AvvM=AMATvTMv>0vTMv=(Av)TAMATAv>0vTATAMATAv>0ATAvTMv>0
Konstantin Schubert
0

Les matrices de variance-covariance sont toujours symétriques, comme le prouve l'équation réelle pour calculer chaque terme de ladite matrice.

De plus, les matrices de variance-covariance sont toujours des matrices carrées de taille n, où n est le nombre de variables de votre expérience.

Les vecteurs propres des matrices symétriques sont toujours orthogonaux.

Avec PCA, vous déterminez les valeurs propres de la matrice pour voir si vous pouviez réduire le nombre de variables utilisées dans votre expérience.

GEN
la source
1
Bienvenue Gen. Notez que votre nom d'utilisateur, identicon, et un lien vers votre page d'utilisateur sont automatiquement ajoutés à chaque message que vous publiez, il n'est donc pas nécessaire de signer vos messages.
Antoine Vernet
3
Cette réponse pourrait être améliorée en abordant le problème de la définition positive
Silverfish le
Cela ne répond pas vraiment à la question: il s’agit simplement d’un ensemble d’affirmations non prises en charge qui peuvent être pertinentes ou non. Pourriez-vous reformuler la question de manière à montrer comment on répond à la question et à expliquer le raisonnement?
whuber
0

J'ajouterais à l'argument avancé de Zen ce qui suit, ce qui explique pourquoi nous disons souvent que la matrice de covariance est définie positive si .n1k

Si sont un échantillon aléatoire d'une distribution de probabilité continue, alors sont presque sûrement (au sens de la théorie des probabilités) linéairement indépendants. Maintenant, ne sont pas linéairement indépendants car , mais à cause de étant aussi indépendant linéairement, as span . Si , ils couvrent également .x1,x2,...,xnx1,x2,...,xnz1,z2,...,zni=1nzi=0x1,x2,...,xnR n - 1 n - 1 k R kz1,z2,...,znRn1n1kRk

En conclusion, si sont un échantillon aléatoire d'une distribution de probabilité continue et , la matrice de covariance est définie positive. n - 1 kx1,x2,...,xnn1k

Giominas
la source
0

Pour ceux qui, comme moi, n’ont pas une formation mathématique et qui n’arrivent pas à comprendre rapidement les formules mathématiques abstraites, il s’agit d’un excellent exemple pour la réponse la plus élevée. La matrice de covariance peut également être dérivée d’une autre manière.

entrez la description de l'image ici

entrez la description de l'image ici

Parikshit Bhinde
la source
Pouvez-vous expliquer comment cette feuille de calcul démontre la définition positive de la matrice de covariance?
whuber
Ce ne est pas. J'ai eu du mal à visualiser la matrice de covariance sous sa forme notationnelle elle-même. J'ai donc créé cette feuille pour moi-même et j'ai pensé que cela pourrait aider quelqu'un.
Parikshit Bhinde
Modifiez-le pour inclure une réponse à la question.
whuber
Fait :) Merci de suggérer.
Parikshit Bhinde le
La question est "est-il alors garanti d'avoir une matrice symétrique et définie positive?" Je suis incapable de percevoir un élément de votre message qui traite de cela, car (1) il n'identifie jamais une matrice de covariance; (2) il ne démontre pas la netteté positive de rien.
whuber