Autant que je sache, les principales composantes sont obtenues en faisant tourner les axes de coordonnées pour les aligner avec les directions de variance maximale.
Néanmoins, je continue à lire sur les "composants principaux non tournés" et mon logiciel de statistiques (SAS) me donne les composants principaux à rotation varimax ainsi que ceux non tournés. Ici, je suis confus: lorsque nous calculons les composants principaux, les axes sont déjà tournés; alors pourquoi une autre rotation est-elle nécessaire? Et que signifie «composante principale non tournée»?
pca
terminology
factor-rotation
Srewashi Lahiri
la source
la source
Réponses:
Ce sera une réponse non technique.
Vous avez raison: l'ACP est essentiellement une rotation des axes de coordonnées, choisie de telle sorte que chaque axe réussi capture autant de variance que possible.
Dans certaines disciplines (comme par exemple la psychologie), les gens aiment appliquer l'ACP afin d'interpréter les axes résultants. C'est-à-dire qu'ils veulent pouvoir dire que l'axe principal n ° 1 (qui est une certaine combinaison linéaire de variables originales) a une signification particulière. Pour deviner ce sens, ils examineraient les poids dans la combinaison linéaire. Cependant, ces poids sont souvent désordonnés et aucune signification claire ne peut être discernée.
Dans ces cas, les gens choisissent parfois de bricoler un peu avec la solution PCA vanille. Ils prennent un certain nombre d'axes principaux (qui sont considérés comme "significatifs" par certains critères) et les font tourner en plus, essayant de réaliser une "structure simple" --- c'est-à-dire des combinaisons linéaires qui seraient plus faciles à interpréter. Il existe des algorithmes spécifiques qui recherchent la structure la plus simple possible; l'un d'eux est appelé varimax. Après rotation varimax, les composants successifs ne captent plus autant de variance que possible! Cette fonctionnalité de PCA est rompue en effectuant la rotation varimax supplémentaire (ou toute autre).
Donc, avant d'appliquer la rotation varimax, vous avez des composants principaux "non tournés". Et après, vous obtenez des composants principaux "tournés". En d'autres termes, cette terminologie fait référence au post-traitement des résultats de l'ACP et non à la rotation de l'ACP elle-même.
Tout cela est quelque peu compliqué par le fait que ce qui est mis en rotation, ce sont les chargements et non les axes principaux en tant que tels. Cependant, pour les détails mathématiques, je vous renvoie (et tout lecteur intéressé) à ma longue réponse ici: L'ACP suivie d'une rotation (comme varimax) est-elle toujours PCA?
la source
what gets rotated are loadings and not principal axes as such
J'ajouterais qu'il s'agit d'une notion technique. Théoriquement, ces deux types de rotation sont juxtapositifs. Dans l'ACP, nous tournons pour trouver la base orthogonale spécifique (celle avec le tracé d'éboulis le plus raide de valeurs propres). Dans varimax, nous tournons pour trouver une autre base orthogonale spécifique (avec la structure la plus interpétable). Nous pourrions faire n'importe quel type de base orthogonale.