Comme indiqué dans cette question, le rang maximum de la matrice de covariance est où est la taille de l'échantillon et donc si la dimension de la matrice de covariance est égale à la taille de l'échantillon, elle serait singulière. Je ne comprends pas pourquoi nous soustrayons du rang maximum de la matrice de covariance.1 n
covariance-matrix
linear-algebra
user3070752
la source
la source
Réponses:
L'estimateur sans biais de la matrice de covariance de l'échantillon étant donné points de données x i ∈ R d est C = 1n xi∈Rd où ˉ x =∑xi/nest la moyenne sur tous les points. Notons(x
Pourquoi a-t-il le rangn-1et non le rangn, comme il semblerait parce que nous additionnonsnmatrices derang1?∑ziz⊤i n−1 n n 1
La réponse est que cela se produit parce que ne sont pas indépendants. Par construction, ∑ z i = 0 . Donc, si vous connaissez n - 1 de z i , alors le dernier z n restant est complètement déterminé; nous ne sommes pas sommateur n rank- indépendantes 1 matrices, nous sommateur seulement n - 1 rank- indépendants 1 matrices, puis en ajoutant une plus rank- 1 matrice qui est entièrement linéaire déterminée par le reste. Ce dernier ajout ne modifie pas le classement général.zi ∑zi=0 n−1 zi zn n 1 n−1 1 1
Nous pouvons voir cela directement si nous réécrivons comme z n = - n - 1 ∑ i = 1 z i , et maintenant nous le connectons à l'expression ci-dessus: n ∑ i = 1 z i z ⊤ i = n - 1 ∑ i = 1 z i z ⊤ i + ( - n - 1 ∑ i = 1∑zi=0
la source
Je pense que l'explication est un peu plus courte:
De toute évidence, le rang de la matrice de covariance est ler a n k ( zzT) .
Par théorème de nullité de rang :r a n k ( zzT) = r a n k ( z) = m i n ( n , m - 1 ) .
la source