Quelle matrice doit être interprétée dans l'analyse factorielle: matrice de modèle ou matrice de structure?

8

Lorsque vous effectuez une analyse factorielle (par factorisation de l'axe principal, par exemple) ou une analyse des composants principaux en tant qu'analyse factorielle, et après avoir effectué une rotation oblique des chargements, - quelle matrice utilisez-vous ensuite afin de comprendre quels articles se chargent sur quels facteurs et d'interpréter les facteurs, - matrice de modèle ou matrice de structure ?

J'ai lu dans un livre que la plupart des chercheurs utilisent souvent la matrice de motifs parce qu'elle est plus facile à analyser, mais l'auteur a suggéré de vérifier les résultats avec ceux de la matrice de structure. Cependant, dans mon cas, il existe de nombreuses différences entre ces deux tableaux et je ne sais pas lequel utiliser pour spécifier et étiqueter mes facteurs.

Katigkou
la source

Réponses:

11

Laissez - moi vous recommande de lire d' abord ce Q / A . Il s'agit de rotations et peut suggérer ou répondre partiellement à votre question.

Une réponse plus précise de ma part à propos de l'interprétation pourrait être la suivante. Théoriquement, le facteur d'analyse factorielle est une caractéristique latente univariée, ou essence. Ce n'est pas la même chose qu'un ensemble ou un groupe de phénomènes. Le terme «construire» en psychométrie est générique et pourrait être conceptualisé comme facteur (essence) ou cluster (prototype) ou autre chose. Le facteur étant une essence univariée, il doit être interprété comme le sens (relativement simple) se trouvant sur (ou "derrière") l' intersection des significations / contenus des variables chargées par le facteur.

Avec une rotation oblique, les facteurs ne sont pas orthogonaux; cependant, nous préférons généralement interpréter un facteur comme une entité propre par rapport aux autres facteurs. Autrement dit, l' étiquette du facteur X se dissocierait d'une étiquette du facteur Y corrélé, pour souligner l'individualité des deux facteurs, tout en supposant que «dans la réalité extérieure», ils sont en corrélation. La corrélation devient ainsi une caractéristique isolée des entités à partir des étiquettes des entités.

S'il s'agit de la stratégie généralement préférée , la matrice de modèle semble être le principal outil d'interprétation. Les coefficients de la matrice de modèle sont les charges ou investissements uniques du facteur donné dans les variables. Parce que ce sont des coefficients de régression . [J'insiste sur le fait qu'il vaut mieux dire «facteur de charge variable» que «facteur de charge variable».] La matrice de structure contient des corrélations (d'ordre zéro) entre les facteurs et les variables. Plus deux facteurs X et Y sont corrélés, plus l'écart peut être important entre les chargements de modèle et les chargements de structure sur certaines variables V. Alors que V devrait être de plus en plus corrélé avec les deux facteurs, les coefficients de régression peuvent augmenter à la fois1ou un seul des deux. Ce dernier cas signifiera que c'est cette partie de X qui est différente de Y qui charge tant V; et de là, le coefficient de configuration VX est ce qui est très précieux dans l'interprétation de X.

Le côté faible de la matrice de motifs est qu'elle est moins stable d'un échantillon à l'autre (comme d'habitude les coefficients de régression par rapport aux coefficients de corrélation). S'appuyer sur la matrice des motifs dans l'interprétation nécessite une étude bien planifiée avec une taille d'échantillon suffisante. Pour une étude pilote et une matrice de structure d'interprétation provisoire, il pourrait être préférable de choisir.

La matrice de structure me semble potentiellement meilleure que la matrice de modèle dans l'interprétation inverse des variables par facteurs, si une telle tâche se présente. Et cela peut augmenter lorsque nous validons les éléments dans la construction du questionnaire, c'est-à-dire que nous décidons quelles variables sélectionner et lesquelles baisser dans l'échelle en cours de création. N'oubliez pas qu'en psychométrie, le coefficient de validité commun est le coefficient de corrélation (et non de régression) entre la construction / le critère et l'item. Habituellement, j'inclus un élément dans une échelle de cette façon: (1) regardez la corrélation maximale (matrice de structure) dans la ligne de l'élément; (2) si la valeur est supérieure à un seuil (disons, 0,40), sélectionnez l'élément sisa situation dans la matrice de configuration confirme la décision (c'est-à-dire que l'élément est chargé par le facteur - et de préférence uniquement par celui-ci - quelle échelle nous construisons). La matrice des coefficients des scores des facteurs est également utile en plus des charges de modèle et de structure dans le travail des éléments de sélection pour une construction de facteurs.

Si vous ne percevez pas une construction comme un trait univarié, alors l'utilisation de l'analyse factorielle classique serait remise en question. Le facteur est mince et élégant, ce n'est pas comme un pangolin ou une brassée de quoi que ce soit. Variable chargée par elle est son masque: facteur qu'il montre à travers ce qui semble être tout à fait pas ce facteur en elle.


1 Les chargements de motif sont les coefficients de régression de l' équation du modèle factoriel . Dans le modèle, la variable en cours de prédiction est censée être une caractéristique observée standardisée (dans une AF de corrélations) ou centrée (dans une AF de covariances), tandis que les facteurs sont des caractéristiques latentes normalisées (avec la variance 1). Les coefficients de cette combinaison linéaire sont les valeurs de la matrice de motifs. Comme le montre clairement les images ci-dessous - les coefficients de configuration ne sont jamais supérieurs aux coefficients de structure qui sont des corrélations ou des covariances entre la variable prédite et les facteurs standardisés.


Un peu de géométrie . Les chargements sont des coordonnées de variables (en tant que leurs extrémités vectorielles) dans l'espace factoriel. Nous avons l'habitude de rencontrer ceux sur les «parcelles de chargement» et les «biplots». Voir les formules .

entrez la description de l'image ici

La gauche. Sans rotation ou avec rotation orthogonale, les axes (facteurs) sont géométriquement orthogonaux (ainsi que statistiquement non corrélés) les uns aux autres. Les seules coordonnées possibles sont carrées comme ce qui est montré. C'est ce qu'on appelle des valeurs de «matrice de chargement de facteurs».

Droite. Après la rotation oblique, les facteurs ne sont plus orthogonaux (et statistiquement ils sont corrélés). Ici, deux types de coordonnées peuvent être tracées: perpendiculaire (et qui sont des valeurs de structure, corrélations) et asymétrique (ou, pour dire un mot, "alloparallèle": et qui sont des valeurs de motif, des poids de régression).

Bien sûr, il est possible de tracer les coordonnées du motif ou de la structure tout en forçant les axes à être géométriquement orthogonaux sur le tracé - c'est ce que vous prenez lorsque vous prenez la table des chargements (motif ou structure) et donnez à votre logiciel de construire un nuage de points standard de ceux-ci, - mais alors l'angle entre les vecteurs variables apparaîtra élargi. Il s'agira donc d'un tracé de chargement déformé, car l'angle d'origine susmentionné était le coefficient de corrélation entre les variables.

Voir l'explication détaillée d'un tracé de chargement (dans les paramètres de facteurs orthogonaux) ici .

ttnphns
la source
3
Un gros +1 de ma part pour une réponse aussi détaillée.
amoeba
Une petite précision: ces complications ne surviennent-elles pas dans le cas de rotations orthogonales comme le varimax? N'y a-t-il donc pas de distinction entre matrice de structure et matrice, et la seule matrice pertinente est la matrice de charges [tournées]?
amoeba
2
Oui, sans rotation ou avec une matrice de structure de rotation orthogonale et une matrice de motif ne font qu'un, et sont appelées "matrice de charges". Alors que les principes d'interprétation sont les mêmes - que ce soit une solution orthogonale ou oblique, le processus est plus compliqué dans le cas oblique parce que lorsque vous interprétez le facteur X par "ses" éléments, vous devez en même temps regarder autour d'un corrélé facteur Y, pour échapper à la contamination de leur signification.
ttnphns