Comment trouver la variance entre des points multidimensionnels?

12

Supposons que j'ai une matrice X qui est n par p, c'est-à-dire qu'elle a n observations, avec chaque observation dans l'espace p-dimensionnel.

Comment trouver la variance de ces n observations?

Dans le cas où p = 1, il me suffit d'utiliser la formule de variance régulière. Qu'en est-il des cas où p> 1.

statnub
la source

Réponses:

18

Pour une variable aléatoire à dimensions , nous avons la définition suivante de la variance:pX=(X1,,Xp)

Vuner(X)=E[(X-EX)(X-EX)]=(Vuner(X1)Cov(X1,Xp)Cov(Xp,X1)Vuner(Xp))

C'est-à-dire que la variance d'un vecteur aléatoire est définie comme la matrice qui stocke toutes les variances sur la diagonale principale et les covariances entre les différentes composantes des autres éléments. L'échantillon la matrice de covariance serait alors calculé en branchant les analogues d'échantillons pour les variables de population:p×p

1n-1(je=1n(Xje1-X¯1)2je=1n(Xje1-X¯1)(Xjep-X¯p)je=1n(Xjep-X¯p)(Xje1-X¯1)je=1n(Xjep-X¯p)2)
où désigne la ème observation pour la caractéristique et la moyenne de l'échantillon duXjejjejX¯jje fonctionnalité. Pour résumer, la variance d'un vecteur aléatoire est définie comme la matrice contenant les variances et covariances individuelles. Il suffit donc de calculer individuellement les variances et covariances de l'échantillon pour toutes les composantes vectorielles.
Philipp Burckhardt
la source