Quelle est la raison intuitive derrière les rotations dans l'analyse factorielle / ACP et comment sélectionner la rotation appropriée?

33

Mes questions

  1. Quelle est la raison intuitive derrière la rotation des facteurs dans l'analyse factorielle (ou des composants de la PCA)?

    D'après ce que je comprends, si les variables sont presque également chargées dans les principaux composants (ou facteurs), il est évidemment difficile de différencier les composants. Donc, dans ce cas, on pourrait utiliser la rotation pour obtenir une meilleure différenciation des composants. Est-ce correct?

  2. Quelles sont les conséquences des rotations? Qu'est-ce que cela affecte?

  3. Comment choisir la rotation appropriée? Il y a des rotations orthogonales et des rotations obliques. Comment choisir entre ceux-ci et quelles sont les implications de ce choix?

S'il vous plaît expliquer intuitivement avec le moins d'équations mathématiques. La plupart des réponses étalées étaient lourdes en mathématiques, mais je recherche davantage des raisons intuitives et des règles empiriques.

GeorgeOfTheRF
la source

Réponses:

34
  1. Raison de la rotation . Les rotations sont effectuées dans un souci d’interprétation des facteurs extraits dans l’analyse factorielle (ou des composants de l’ACP, si vous envisagez d’utiliser l’ACP comme technique d’analyse factorielle). Vous avez raison lorsque vous décrivez votre compréhension. La rotation est effectuée à la recherche d'une structure de la matrice de chargement, que l'on peut appeler une structure simple . C’est lorsque différents facteurs ont tendance à charger différentes variables1. [Je pense qu'il est plus correct de dire qu '"un facteur charge une variable" que "une variable charge un facteur", car c'est le facteur qui est "dans" ou "derrière" les variables pour les rendre corrélées, mais vous pouvez dire comme vous le souhaitez.] Dans un sens, la structure simple typique est celle où apparaissent les "grappes" de variables corrélées. Vous interprétez ensuite un facteur comme la signification qui se trouve à l' intersection de la signification des variables suffisamment chargées par le facteur; ainsi, pour recevoir un sens différent, les facteurs doivent charger les variables de manière différentielle. En règle générale, un facteur doit charger correctement au moins 3 variables.

  2. Conséquences . La rotation ne modifie pas la position des variables les unes par rapport aux autres dans l'espace des facteurs, c'est-à-dire que les corrélations entre variables sont préservées. Ce qui change, ce sont les coordonnées des points finaux des vecteurs variables sur les axes des facteurs - les chargements (veuillez rechercher sur ce site "plot de chargement" et "biplot", pour en savoir plus) . Après une rotation orthogonale de la matrice de chargement, les variances des facteurs sont modifiées, mais les facteurs restent non corrélés et les communalités variables sont préservées.2

    Dans une rotation oblique, les facteurs peuvent perdre leur décorrélation si cela produit une "structure simple" plus claire. Cependant, l'interprétation de facteurs corrélés est un art plus difficile car il faut dériver le sens d'un facteur pour qu'il ne contamine pas le sens d'un autre facteur avec lequel il est en corrélation. Cela implique que vous devez interpréter les facteurs, disons, en parallèle, et non les uns après les autres. Feuilles de rotation oblique vous avec deux matrices de charges au lieu d'une matrice: motif et de la matrice de structure . ( , où est la matrice de corrélations entre les facteurs; , oùPSS=PCCC=QQQest la matrice de rotation oblique: , où était la matrice de chargement avant toute rotation.) La matrice de modèle est la matrice de pondérations régressives en fonction de laquelle les facteurs prédisent les variables, tandis que la matrice de structure correspond aux corrélations (ou covariances) entre facteurs et variables. La plupart du temps, nous interprétons les facteurs par les chargements de modèle, car ces coefficients représentent l'investissement individuel unique du facteur dans une variable. Rotation oblique préserve points communs variables, mais les points communs ne sont plus égales aux sommes des lignes de carrés dans ou en . De plus, en raison de la corrélation des facteurs, leurs variances se superposent partiellement .S=AQAPS3

    Bien entendu, les rotations orthogonales et obliques affectent les scores de facteurs / composantes que vous pourriez vouloir calculer (veuillez rechercher des "scores de facteurs" sur ce site). La rotation, en effet, vous donne d' autres facteurs que ceux que vous aviez juste après l'extraction . Ils héritent de leur pouvoir prédictif (pour les variables et leurs corrélations), mais ils auront une signification substantielle différente de votre part. Après la rotation, vous ne pouvez pas dire "ce facteur est plus important que celui-là", car ils ont été alternés (pour être honnête, en FA, contrairement à la PCA, il est difficile de le dire même après l'extraction, car les facteurs sont modélisés comme déjà "importants").4

  3. Choix . Il existe de nombreuses formes de rotations orthogonales et obliques. Pourquoi? Premièrement, parce que le concept de "structure simple" n’est pas univoque et peut être formulé de manière quelque peu différente. Par exemple, varimax - la méthode orthogonale la plus répandue - tente de maximiser la variance entre les valeurs au carré des charges de chaque facteur; la méthode orthogonale parfois utilisée quartimax minimise le nombre de facteurs nécessaires pour expliquer une variable et produit souvent ce que l'on appelle le "facteur général". Deuxièmement, différentes rotations visent différents objectifs latéraux en dehors de la structure simple. Je n’entrerai pas dans les détails de ces sujets complexes, mais vous voudrez peut-être vous renseigner sur ces sujets.

    Faut-il préférer une rotation orthogonale ou oblique? Eh bien, les facteurs orthogonaux sont plus faciles à interpréter et l'ensemble du modèle factoriel est statistiquement plus simple (prédicteurs orthogonaux, bien sûr). Mais là, vous imposez l’ orthogonalité aux traits latents que vous souhaitez découvrir; Êtes-vous sûr qu'ils ne devraient pas être corrélés dans le domaine que vous étudiez? Et s'ils ne le sont pas? Méthodes de rotation obliques5(bien que chacun ait ses propres penchants), permettent, mais ne forcent pas, la corrélation de facteurs et sont donc moins restrictifs. Si la rotation oblique montre que les facteurs ne sont que faiblement corrélés, vous pouvez être sûr que c'est "en réalité", et vous pouvez alors vous tourner vers la rotation orthogonale avec conscience. Par contre, si les facteurs sont très corrélés, cela ne semble pas naturel (pour des traits latents distincts sur le plan conceptuel, en particulier si vous développez un inventaire en psychologie ou autre, rappelez-vous qu'un facteur est lui - même un trait univarié, et non un lot de phénomènes), et vous voudrez peut-être extraire moins de facteurs, ou bien utiliser les résultats obliques comme source de lot pour extraire les facteurs dits de second ordre.


1 Thurstone a présenté cinq conditions idéales de structure simple. Les trois plus importants sont: (1) chaque variable doit avoir au moins une charge proche de zéro; (2) chaque facteur doit avoir des charges proches de zéro pour au moins m variables ( m étant le nombre de facteurs); (3) pour chaque couple de facteurs, il existe au moins m variables avec des chargements proches de zéro pour l’un d’eux et suffisamment éloignées de zéro pour l’autre. Par conséquent, pour chaque paire de facteurs, leur diagramme de chargement devrait idéalement ressembler à:

entrez la description de l'image ici

Ceci est pour une FA purement exploratoire, alors que si vous faites et refait FA pour développer un questionnaire, vous voudrez éventuellement supprimer tous les points sauf les bleus, à condition que vous n'ayez que deux facteurs. S'il y a plus de deux facteurs, vous souhaiterez que les points rouges deviennent bleus pour les tracés de chargement des autres facteurs.


2

entrez la description de l'image ici


3 La variance d'un facteur (ou d'une composante) est la somme de ses chargements de structure au carré , car il s'agit de covariances / corrélations entre des variables et de facteurs (à l'échelle de l'unité). Après la rotation oblique, les facteurs peuvent être corrélés et leurs variances se croisent. Par conséquent, la somme de leurs variances, SS , est supérieure à la communalité globale expliqué, SS . Si vous voulez compter après le facteur i uniquement la partie "propre" unique de sa variance, multipliez la variance par de la dépendance du facteur aux autres facteurs, la quantité connue sous le nom d' anti-image . C'est l'inverse du ième élément diagonal deSSA1Ri2C1. La somme des parties "nettes" des variances sera inférieure à la communauté globale expliquée.


4 Vous ne pouvez pas dire "le premier facteur / composant modifié en rotation de telle ou telle manière" car le premier facteur / composant de la matrice de chargement pivotée est différent de celui du premier dans la matrice de chargement non pivotée. Le même numéro ordinal ("1er") est trompeur.


5 deux méthodes les plus importantes en oblique sont promax et oblimin . Promax est le rehaussement oblique du varimax: la structure à base de varimax est ensuite relâchée afin de respecter davantage la "structure simple". Il est souvent utilisé en confirmation FA. Oblimin est très flexible en raison de son paramètre gamma qui, lorsqu'il est défini sur 0, fait de l'oblimin la méthode du quartimin donnant la plupart des solutions obliques. Un gamma de 1 donne les solutions les moins obliques, la covarimin, qui est encore une autre méthode oblique à base de varimax alternative à promax. Toutes les méthodes obliques peuvent être des versions directes (= primaires) et indirectes (= secondaires) - voir la littérature. Toutes les rotations, orthogonales et obliques, peuvent être effectuées avec la normalisation Kaiser(généralement) ou sans. La normalisation rend toutes les variables d'égale importance lors de la rotation.


Quelques discussions pour en savoir plus:

Peut-il y avoir une raison de ne pas alterner les facteurs?

Quelle matrice interpréter après une rotation oblique - motif ou structure?

Que signifient les noms de techniques de rotation de facteurs (varimax, etc.)?

La PCA avec composants en rotation est-elle toujours en rotation ou une analyse factorielle?

tnphns
la source
1
+1 Depuis que j'ai vu cette question, j'espérais que vous apporteriez une réponse. A propos, j'ai été surpris qu'une telle question n'ait pas été posée ici auparavant (du moins pas sous une forme aussi claire).
amibe dit de réintégrer Monica
+1 Merci pour la réponse! 1) Je comprends l'analyse factorielle et l'ACP séparément, mais qu'entendez-vous par "ACP comme technique d'analyse factorielle"? PCA et FA sont deux choses différentes à rencontrer deux objectifs distincts, n'est-ce pas? Cela signifie-t-il que lorsque des composants PCA ont une structure complexe, je ne peux pas utiliser la rotation pour simplifier?
GeorgeOfTheRF
2) "Varimax essaie de maximiser la variance entre les charges de chaque facteur" Quel est l’avantage de maximiser la variance entre les charges?
GeorgeOfTheRF
Pour votre (1) dans les commentaires: Oui, les deux méthodes d'analyse sont différentes. Pourtant, les gens utilisent parfois la PCA aux fins de la FA. Voir ma réponse et tout le fil pertinent ici. Vous pouvez utiliser les rotations de facteurs dans PCA exactement de la même manière que dans FA et sur les mêmes réseaux. En ce qui concerne la rotation, il n'y a pas de différence.
15h15
Pour votre commentaire (2). Varimax maximise la variance de la magnitude absolue des charges: par conséquent, les charges des facteurs pour chaque facteur "se séparent" clairement en (absolument) grandes et petites. Quartimax essaie de faire en sorte que chaque variable soit chargée beaucoup seulement par un facteur.
15h à 16h29