Qu'est-ce que l'on appelle exactement «composante principale» dans l'ACP?

18

Supposons que est le vecteur qui maximise la variance de la projection des données avec la matrice de conception XuX .

Maintenant, j'ai vu des documents qui font référence à u comme le (premier) composant principal des données, qui est également le vecteur propre avec la plus grande valeur propre.

Cependant, j'ai également vu que la principale composante des données est Xu .

Évidemment, et et X u sont des choses différentes. Quelqu'un peut-il m'aider ici et me dire quelle est la différence entre ces deux définitions des principaux composants?uXu

mon nom est Jeff
la source
Le vecteur propre u est la direction de l'axe (les valeurs de u sont la direction des cosinus par rapport aux axes d'origine). Xu est les données elles-mêmes, les valeurs de la composante principale, les coordonnées sur l'axe susmentionné).
ttnphns

Réponses:

25

Vous avez tout à fait raison d'observer que même si (l'un des vecteurs propres de la matrice de covariance, par exemple le premier) et X u (projection des données sur le sous-espace à 1 dimension couvert par uuXuu ) sont deux choses différentes, on les appelle souvent "composant principal", parfois même dans le même texte.

uje

uXu

u

uXu "scores de composante principale".

Résumé des deux conventions:

Convention 1Convention 2u{axe principaldirection principalevecteur composant principalcomposant principalXucomposant principalscores des composantes principales

Remarque: Seuls les vecteurs propres de la matrice de covariance correspondant à des valeurs propres non nulles peuvent être appelés directions / composantes principales. Si la matrice de covariance est de bas rang, elle aura une ou plusieurs valeurs propres nulles; les vecteurs propres correspondants (et les projections correspondantes qui sont à zéro constant) ne doivent pas être appelés directions / composantes principales. Voir une discussion dans ma réponse ici.

amibe dit réintégrer Monica
la source
1
La Convention 2 devrait être interdite. Il a la capacité de créer une fin de confusion pour les débutants car il confond les vecteurs de base et les composants des vecteurs de données par rapport à la base.
conjectures
qu'en est-il de la définition des chargements? Les chargements sont-ils les valeurs individuelles du vecteur propre u?
makis
@amoeba merci! une dernière question. En SVD, pour X = USVh (Vh: V transposé) si les vecteurs propres sont les colonnes de U, puis-je appeler Vh comme chargements?
makis
@sera No. Voir stats.stackexchange.com/questions/134282
amibe dit