Comment trouver la variance entre des points multidimensionnels?

Pour une variable aléatoire à dimensions , nous avons la définition suivante de la variance: $p$ $X = {\left( {{X_1}, \ldots ,{X_p}} \right)^\intercal}$

V une r (X) = E [(X - E X) {(X - E X)}^{⊺}] = (\begin{matrix} V une r (X_{1}) & \dots & C o v (X_{1}, X_{p}) \\ ⋮ & ⋱ & ⋮ \\ C o v (X_{p}, X_{1}) & \dots & V une r (X_{p}) \end{matrix})

$Var\left( X \right) = E\left[ {\left( {X - EX} \right){{\left( {X - EX} \right)}^\intercal}} \right] = \left( {\begin{array}{*{20}{c}} {Var\left( {{X_1}} \right)}& \ldots &{Cov\left( {{X_1},{X_p}} \right)} \\ \vdots & \ddots & \vdots \\ {Cov\left( {{X_p},{X_1}} \right)}& \ldots &{Var\left( {{X_p}} \right)} \end{array}} \right)$

C'est-à-dire que la variance d'un vecteur aléatoire est définie comme la matrice qui stocke toutes les variances sur la diagonale principale et les covariances entre les différentes composantes des autres éléments. L'échantillon la matrice de covariance serait alors calculé en branchant les analogues d'échantillons pour les variables de population: $p \times p$

\frac{1}{n - 1} (\begin{matrix} \sum_{je = 1}^{n} {(X_{je 1} - {\bar{X}}_{\cdot 1})}^{2} & \dots & \sum_{je = 1}^{n} (X_{je 1} - {\bar{X}}_{\cdot 1}) (X_{je p} - {\bar{X}}_{\cdot p}) \\ ⋮ & ⋱ & ⋮ \\ \sum_{je = 1}^{n} (X_{je p} - {\bar{X}}_{\cdot p}) (X_{je 1} - {\bar{X}}_{\cdot 1}) & \dots & \sum_{je = 1}^{n} {(X_{je p} - {\bar{X}}_{\cdot p})}^{2} \end{matrix})

$\frac{1}{{n - 1}}\left( {\begin{array}{*{20}{c}} {\sum\limits_{i = 1}^n {{{\left( {{X_{i1}} - {{\bar X}_{\cdot1}}} \right)}^2}} }& \ldots &{\sum\limits_{i = 1}^n {\left( {{X_{i1}} - {{\bar X}_{\cdot1}}} \right)\left( {{X_{ip}} - {{\bar X}_{\cdot p}}} \right)} } \\ \vdots & \ddots & \vdots \\ {\sum\limits_{i = 1}^n {\left( {{X_{ip}} - {{\bar X}_{\cdot p}}} \right)\left( {{X_{i1}} - {{\bar X}_{\cdot 1}}} \right)} }& \ldots &{\sum\limits_{i = 1}^n {{{\left( {{X_{ip}} - {{\bar X}_{\cdot p}}} \right)}^2}} } \end{array}} \right)$ où désigne la ème observation pour la caractéristique et la moyenne de l'échantillon du

X_{i j}

${X_{ij}}$

i

$i$

j

$j$

{\bar{X}}_{\cdot j}

${{\bar X}_{ \cdot j}}$

j

$j$ e fonctionnalité. Pour résumer, la variance d'un vecteur aléatoire est définie comme la matrice contenant les variances et covariances individuelles. Il suffit donc de calculer individuellement les variances et covariances de l'échantillon pour toutes les composantes vectorielles.

Philipp Burckhardt
la source

Comment trouver la variance entre des points multidimensionnels?

Réponses: