Que sont les composantes principales «tournées» et «non tournées», étant donné que PCA fait toujours tourner les axes de coordonnées?

13

Autant que je sache, les principales composantes sont obtenues en faisant tourner les axes de coordonnées pour les aligner avec les directions de variance maximale.

Néanmoins, je continue à lire sur les "composants principaux non tournés" et mon logiciel de statistiques (SAS) me donne les composants principaux à rotation varimax ainsi que ceux non tournés. Ici, je suis confus: lorsque nous calculons les composants principaux, les axes sont déjà tournés; alors pourquoi une autre rotation est-elle nécessaire? Et que signifie «composante principale non tournée»?

Srewashi Lahiri
la source
1
Les questions uniquement sur le fonctionnement des logiciels sont hors sujet ici, mais vous pouvez avoir une vraie question statistique enterrée ici. Vous pouvez modifier votre question pour clarifier le problème statistique sous-jacent. Vous pouvez constater que lorsque vous comprenez les concepts statistiques impliqués, les éléments spécifiques au logiciel sont évidents ou au moins faciles à obtenir à partir de la documentation.
gung - Rétablir Monica
1
@gung - Ma question ne concerne pas les logiciels. Peut-être que je l'ai mal placé. Tout ce que je voulais savoir, c'est qu'à ma connaissance, nous n'obtenons les principales composantes que lorsque nous faisons pivoter les axes dans la ligne de variance maximale. Ensuite, quel est le composant principal non rotatif, un terme que j'ai trouvé sur diverses pages expliquant l'ACP. Veuillez me faire savoir si ma question est toujours ambiguë.
Srewashi Lahiri
Il semble que cela concerne SAS. Si ce n'est pas le cas, je modifierais votre Q pour supprimer les références à SAS et ré-expliquer votre question en termes neutres sur le plan logiciel. Vous pouvez également être intéressé par la lecture de ce fil .
gung - Réintégrer Monica
J'ai mentionné SAS parce que je faisais l'analyse dans ce logiciel. Même si vous ne tenez pas compte du mot, vous pouvez simplement me fournir une explication à ma version éditée de la question. J'ai aussi parcouru le fil. Veuillez me corriger si je me trompe. Lorsque nous calculons les composants principaux, cela signifie que les axes sont déjà tournés. Une autre notation varimax n'est donc pas requise. Est-ce vrai? Je suis vraiment confus à propos de cette partie. Merci d'avance
Srewashi Lahiri
2
Srewashi, j'ai pris la liberté de réécrire substantiellement votre question sur la base de vos clarifications dans les commentaires. Je pense que c'est une bonne question, +1. Veuillez vérifier que mes modifications reflètent vos intentions! Vous pouvez toujours en éditer plus. Cc à @gung.
amibe dit Réintégrer Monica

Réponses:

15

Ce sera une réponse non technique.

Vous avez raison: l'ACP est essentiellement une rotation des axes de coordonnées, choisie de telle sorte que chaque axe réussi capture autant de variance que possible.

Dans certaines disciplines (comme par exemple la psychologie), les gens aiment appliquer l'ACP afin d'interpréter les axes résultants. C'est-à-dire qu'ils veulent pouvoir dire que l'axe principal n ° 1 (qui est une certaine combinaison linéaire de variables originales) a une signification particulière. Pour deviner ce sens, ils examineraient les poids dans la combinaison linéaire. Cependant, ces poids sont souvent désordonnés et aucune signification claire ne peut être discernée.

Dans ces cas, les gens choisissent parfois de bricoler un peu avec la solution PCA vanille. Ils prennent un certain nombre d'axes principaux (qui sont considérés comme "significatifs" par certains critères) et les font tourner en plus, essayant de réaliser une "structure simple" --- c'est-à-dire des combinaisons linéaires qui seraient plus faciles à interpréter. Il existe des algorithmes spécifiques qui recherchent la structure la plus simple possible; l'un d'eux est appelé varimax. Après rotation varimax, les composants successifs ne captent plus autant de variance que possible! Cette fonctionnalité de PCA est rompue en effectuant la rotation varimax supplémentaire (ou toute autre).

Donc, avant d'appliquer la rotation varimax, vous avez des composants principaux "non tournés". Et après, vous obtenez des composants principaux "tournés". En d'autres termes, cette terminologie fait référence au post-traitement des résultats de l'ACP et non à la rotation de l'ACP elle-même.


Tout cela est quelque peu compliqué par le fait que ce qui est mis en rotation, ce sont les chargements et non les axes principaux en tant que tels. Cependant, pour les détails mathématiques, je vous renvoie (et tout lecteur intéressé) à ma longue réponse ici: L'ACP suivie d'une rotation (comme varimax) est-elle toujours PCA?

amibe dit réintégrer Monica
la source
Je n'ai pas encore trouvé d'explication meilleure et plus claire. J'ai également parcouru l'autre lien que vous avez fourni mais je ne l'ai pas encore déchiffré en totalité. Si j'ai bien compris, les composantes principales non tournées sont déjà orthogonales et non corrélées. Ici, j'ai un peu de confusion - comme les PC correspondent à la variance maximale successive, alors est-il nécessaire qu'après avoir trouvé le premier PC, la deuxième ligne de variance maximale (deuxième PC) sera à 90 degrés (orthogonale) par rapport à la première et ainsi de suite ?
Srewashi Lahiri
C'est vrai: les composantes principales "non tournées" ne sont pas corrélées et les axes principaux "non tournés" sont orthogonaux. Et oui, il faut que les axes principaux successifs soient orthogonaux et les composants principaux non corrélés aux précédents (on peut le prouver mathématiquement). Soit dit en passant, si vous pensez que cette réponse (ou toute autre) règle le problème pour vous, vous pouvez "l'accepter" en cliquant sur la coche verte à gauche. Une fois que vous aurez atteint 15 points de réputation, vous pourrez également voter de manière positive sur les réponses que vous trouvez utiles (je pense que vous ne pouvez actuellement pas voter sur les réponses).
amoeba dit Reinstate Monica
+1. what gets rotated are loadings and not principal axes as suchJ'ajouterais qu'il s'agit d'une notion technique. Théoriquement, ces deux types de rotation sont juxtapositifs. Dans l'ACP, nous tournons pour trouver la base orthogonale spécifique (celle avec le tracé d'éboulis le plus raide de valeurs propres). Dans varimax, nous tournons pour trouver une autre base orthogonale spécifique (avec la structure la plus interpétable). Nous pourrions faire n'importe quel type de base orthogonale.
ttnphns
Si possible, pouvez-vous l'expliquer en termes simples ce que signifie un PC non orienté?
sai_636
@ sai_636 Pour les termes profanes, veuillez consulter stats.stackexchange.com/questions/2691 .
Amoeba dit Reinstate Monica