Sur l'utilisation de la rotation oblique après l'ACP

9

Plusieurs packages statistiques, tels que SAS, SPSS et R, vous permettent d'effectuer une sorte de rotation des facteurs après une PCA.

  1. Pourquoi une rotation est-elle nécessaire après un PCA?
  2. Pourquoi appliquer une rotation oblique après une ACP étant donné que l'objectif de l'ACP est de produire des dimensions orthogonales?
pbneau
la source
J'ai posé une question qui illustre la nécessité d'une rotation factorielle après l'ACP, car l'ACP donne le résultat biaisé. Voir stats.stackexchange.com/questions/6575/…
mbaitoff

Réponses:

8

Je pense qu'il existe des opinions ou des points de vue différents sur PCA, mais en gros, nous la considérons souvent comme une technique de réduction (vous réduisez votre espace de fonctionnalités à un plus petit, souvent beaucoup plus "lisible" à condition de prendre soin de bien centrer / standardiser le données quand elles sont nécessaires) ou un moyen de construire des facteurs latentsou dimensions qui représentent une part importante de la dispersion interindividuelle (ici, les "individus" représentent les unités statistiques sur lesquelles les données sont collectées; cela peut être le pays, les personnes, etc.). Dans les deux cas, nous construisons des combinaisons linéaires des variables d'origine qui représentent le maximum de variance (lorsqu'elles sont projetées sur l'axe principal), soumises à une contrainte d'orthogonalité entre deux composantes principales quelconques. Maintenant, ce qui a été décrit est purement algébrique ou mathématique et nous ne le considérons pas comme un modèle (générateur), contrairement à ce qui est fait dans la tradition de l'analyse factorielle où nous incluons un terme d'erreur pour tenir compte d'une sorte d'erreur de mesure . J'aime aussi l'introduction donnée par William Revelle dans son prochain manuel sur la psychométrie appliquée utilisant R (Chapitre 6), si nous voulons analyser la structure d'une matrice de corrélation, alors

La première [approche, PCA] est un modèle qui rapproche la matrice de corrélation en termes de produit de composants où chaque composant est une somme linéaire pondérée des variables, le deuxième modèle [analyse factorielle] est également une approximation de la matrice de corrélation par le produit de deux facteurs, mais ceux-ci sont considérés comme des causes plutôt que comme des conséquences des variables.

En d'autres termes, avec l'ACP, vous exprimez chaque composante (facteur) comme une combinaison linéaire des variables alors qu'en FA ce sont les variables qui sont exprimées comme une combinaison linéaire des facteurs. Il est bien reconnu que les deux méthodes donneront généralement des résultats assez similaires (voir par exemple Harman, 1976 ou Catell, 1978), en particulier dans le cas "idéal" où nous avons un grand nombre d'individus et un bon facteur de rapport: variables (variant généralement entre 2 et 10 selon les auteurs que vous considérez!). En effet, en estimant les diagonales dans la matrice de corrélation (comme cela est fait dans FA, et ces éléments sont connus sous le nom de communalités), la variance d'erreur est éliminée de la matrice factorielle. C'est la raison pour laquelle l'ACP est souvent utilisée comme un moyen de découvrir des facteurs latents ou des constructions psychologiques à la place de l'AF développée au siècle dernier. Mais, au fur et à mesure que nous avançons dans cette voie, nous voulons souvent parvenir à une interprétation plus facile de la structure factorielle résultante (ou de la matrice dite de modèle). Et puis vient l'astuce utile de faire tourner l'axe factoriel afin que nous maximisions les chargements de variables sur un facteur spécifique, ou atteignons de manière équivalente une "structure simple". En utilisant la rotation orthogonale (par exemple VARIMAX), nous préservons l'indépendance des facteurs. Avec une rotation oblique (par exemple OBLIMIN, PROMAX), nous la cassons et les facteurs sont autorisés à se corréler. Cela a été largement débattu dans la littérature et a conduit certains auteurs (non pas des psychométriciens, mais des statisticiens au début des années 1960).

Mais le fait est que les méthodes de rotation ont été initialement développées dans le contexte de l'approche FA et sont maintenant couramment utilisées avec l'ACP. Je ne pense pas que cela contredit le calcul algorithmique des principales composantes: vous pouvez faire pivoter vos axes factoriels comme vous le souhaitez, à condition de garder à l'esprit qu'une fois corrélée (par rotation oblique) l'interprétation de l'espace factoriel devient moins évidente.

L'ACP est couramment utilisée lors de l'élaboration de nouveaux questionnaires, bien que l'AF soit probablement une meilleure approche dans ce cas, car nous essayons d'extraire des facteurs significatifs qui prennent en compte les erreurs de mesure et dont les relations pourraient être étudiées par elles-mêmes (par exemple en factorisant le modèle résultant). matrice, nous obtenons un modèle de facteur de second ordre). Mais l'ACP est également utilisée pour vérifier la structure factorielle de celles déjà validées. Les chercheurs ne se soucient pas vraiment de l'AF par rapport à l'APC lorsqu'ils ont, disons, 500 sujets représentatifs qui sont invités à évaluer un questionnaire de 60 éléments abordant cinq dimensions (c'est le cas du NEO-FFI, par exemple), et je pense qu'ils ont raison parce que dans ce cas, nous ne sommes pas très intéressés à identifier un modèle générateur ou conceptuel (le terme «représentatif» est utilisé ici pour atténuer le problème de l' invariance de mesure ).

Maintenant, sur le choix de la méthode de rotation et pourquoi certains auteurs s'opposent à l'utilisation stricte de la rotation orthogonale, je voudrais citer Paul Kline, comme je l'ai fait en réponse à la question suivante, FA: Choisir la matrice de rotation, basée sur «Structure simple Critères » ,

(...) dans le monde réel, il n'est pas déraisonnable de penser que des facteurs, en tant que déterminants importants du comportement, seraient corrélés. - P. Kline, renseignement. La vue psychométrique , 1991, p. 19

Je conclurais donc que, selon l'objectif de votre étude (voulez-vous mettre en évidence les principaux schémas de votre matrice de corrélation ou cherchez-vous à fournir une interprétation sensible des mécanismes sous-jacents qui peuvent vous avoir amené à observer une telle matrice de corrélation ), vous êtes libre de choisir la méthode la plus appropriée: cela ne concerne pas la construction de combinaisons linéaires, mais simplement la manière dont vous souhaitez interpréter l'espace factoriel résultant.

Références

  1. Harman, HH (1976). Analyse factorielle moderne . Chicago, University of Chicago Press.
  2. Cattell, RB (1978). L'utilisation scientifique de l'analyse factorielle . New York, plénum.
  3. Kline, P. (1991). Intelligence. La vue psychométrique . Routledge.
chl
la source
4

Le problème avec les dimensions orthogonales est que les composants peuvent être ininterprétables. Ainsi, alors que la rotation oblique (c'est-à-dire les dimensions non orthogonales) est techniquement moins satisfaisante, une telle rotation améliore parfois l'interprétabilité des composants résultants.


la source
4

Points de base

  • La rotation peut rendre l'interprétation des composants plus claire
  • La rotation oblique a souvent un sens plus théorique. C'est-à-dire que les variables observées peuvent être expliquées en termes d'un plus petit nombre de composants corrélés.

Exemple

  • 10 teste toutes les capacités de mesure avec certaines mesures verbales et certaines mesures spatiales. Tous les tests sont intercorrélés, mais les intercorrélations au sein des tests verbaux ou spatiaux sont supérieures à celles des types de test. Une ACP parcimonieuse peut impliquer deux composantes corrélées, une verbale et une spatiale. La théorie et la recherche suggèrent que ces deux capacités sont corrélées. Ainsi, une rotation oblique a un sens théorique.
Jeromy Anglim
la source