Est-il acceptable d'avoir seulement deux (ou moins) éléments (variables) chargés par un facteur dans l'analyse factorielle?

10

J'ai un ensemble de 20 variables que j'ai soumises à l'analyse factorielle dans SPSS. Aux fins de la recherche, j'ai besoin de développer 6 facteurs. SPSS a montré que 8 variables (sur 20) ont été chargées avec des poids faibles ou ont été chargées également par plusieurs facteurs, donc je les ai supprimées. Les 12 variables restantes ont été chargées par paires de 2 dans les 6 facteurs, ce qui est une structure parfaite - tout comme je le voulais, mais maintenant, l'un des professeurs qui travaillent avec moi veut que je trouve une justification pourquoi (ou dans quelles conditions) il convient de ne conserver que 2 éléments par facteur, car il est communément admis que l'analyse factorielle est utile avec les résultats de 3 éléments ou plus chargés, par facteur.

Quelqu'un peut-il m'aider avec ce problème, de préférence avec une référence publiée également?

Mitja
la source
Un facteur d'élément unique est également acceptable si cet élément a une charge de facteur plus élevée.
Meera Gang
«Au moins 3 éléments par facteur» est une recommandation justifiée. Si vous avez, après rotation des facteurs, des résultats avec 2 ou un élément dans un facteur, soit 1) obtenez plus de variables que vous attendez d'être chargées par ce facteur, ou 2) refaites l'analyse et extrayez moins de facteurs, ou 3) laissez le les résultats tels quels mais n'interprètent pas le facteur "nécessiteux", en disant "je crois que ce facteur existe, mais comme il n'est pas suffisamment supporté par les éléments, je le supprime de l'interprétation et des résultats". Cependant, ces 2 recommandations sont différentes.
ttnphns
Voir aussi, en plus des réponses ici, stats.stackexchange.com/a/198684/3277 (poit 5) pourquoi "Au moins 3 articles chargés par facteur" est une exigence raisonnable.
ttnphns

Réponses:

13

Deux ou trois éléments par facteur est une question d'identification de votre modèle CFA (FA confirmatoire).

Supposons pour simplifier que le modèle soit identifié en fixant la variance de chaque facteur à 1. Supposons également qu'il n'y a pas d'erreurs de mesure corrélées.

Un modèle à facteur unique avec deux éléments a deux charges et deux variances d'erreur à estimer = 4 paramètres, mais il n'y a que 3 entrées non triviales dans la matrice de variance-covariance, vous n'avez donc pas assez d'informations pour estimer les quatre paramètres dont vous avez besoin.

Un modèle à facteur unique avec trois éléments a trois charges et trois variances d'erreur. La matrice de variance-covariance comporte six entrées, et un examen analytique minutieux montre que le modèle est exactement identifié, et vous pouvez exprimer algébriquement les estimations des paramètres en fonction des entrées de la matrice de variance-covariance. Avec plus d'éléments par facteur unique, vous avez un modèle sur-identifié (plus de degrés de liberté que de paramètres), ce qui signifie généralement que vous êtes prêt à partir.

Avec plus d'un facteur, le modèle CFA est toujours identifié avec plus de 3 éléments pour chaque facteur (car un modèle de mesure simple est identifié pour chaque facteur, donc en gros, vous pouvez obtenir des prédictions pour chaque facteur et estimer leurs covariances en fonction de cela). Cependant, un CFA avec deux éléments par facteur est identifié à condition que chaque facteur ait une covariance non nulle avec au moins un autre facteur de la population. (Sinon, le facteur en question sort du système et un modèle à deux éléments à facteur unique n'est pas identifié.) La preuve d'identification est plutôt technique et nécessite une bonne compréhension de l'algèbre matricielle.

Bollen (1989) examine de manière approfondie et approfondie les problèmes d'identification des modèles CFA dans le chapitre 7. Voir p. 244 concernant spécifiquement les règles à trois et à deux indicateurs.

StasK
la source
1
C'était une réponse très appropriée. Je voudrais seulement dire (pour le bien du PO) que le PO a posé des questions sur la FA exploratoire (ALE). Il est logique que l'EFA ait «3+ articles chargés par facteur» puisque CFA l'attend; seulement que vous n'en avez pas parlé dans votre réponse.
ttnphns
4

Je n'ai jamais entendu parler du critère "3 items par facteur". Je renverserais la question et demanderais à votre professeur de trouver une référence solide pour cette déclaration.

En plus de cela, "aux fins de la recherche, je dois développer 6 facteurs." est une chose étrange à dire.

L'objectif fondamental de l'analyse factorielle est 1) de savoir combien de facteurs (souvent des traits psychologiques) sous-tendent un nombre (plus important) de variables mesurées. Ensuite 2), à partir des chargements factoriels, on essaie de décrire ce que sont réellement ces facteurs.

Vous ne "développez" pas 6 facteurs, vous "essayez de mesurer" 6 facteurs.

Cependant, les chargements croisés (variables chargées par plusieurs facteurs) présents sont souvent une indication que les facteurs «tentent de se corréler» les uns avec les autres. Ce qui est logique, car nous savons que tout est en corrélation avec tout dans le monde réel. La mise en œuvre de cette observation dans votre analyse en utilisant une rotation oblique (au lieu de la varimax orthogonale) élimine souvent de nombreuses charges croisées. À mon humble avis, il est également plus sain théoriquement.

Donnez un coup de feu, vous pouvez vous retrouver avec plus d'éléments par facteur. Cela peut aussi (en partie) résoudre votre problème.

RubenGeert
la source
Merci beaucoup pour votre commentaire, pourquoi six facteurs que je peux expliquer avec un modèle que j'utilise, mon professeur n'est pas contre une explication à 6 facteurs, mais il veut une explication quand est-il acceptable d'utiliser l'analyse factorielle qui n'a que 2 éléments par facteur . Cela reste toujours la question.
Mitja
Bienvenue sur le site, @ pythonforspss.org, il y a beaucoup de bonnes informations ici, +1. Quelques remarques: J'ai entendu dire à plusieurs reprises que vous avez besoin d'au moins 3 variables par facteur, mais je ne sais pas quelle est la raison substantielle (ou s'il y en a réellement) de cette règle. J'ai édité le Q de l'OP pour rendre l'anglais plus fluide; J'ai ajouté la phrase que vous citez pour remplacer ce qui existait auparavant. Cela n'était peut-être pas idéal (je ne savais pas comment traduire ce que je pensais que l'OP pourrait essayer de dire), mais si c'est le cas, c'est ma faute, pas celle de Mitja. N'oubliez pas que l'anglais n'est pas la première langue de nombreux utilisateurs.
gung - Rétablir Monica
les trois éléments par facteur sont une croyance commune et ont tendance à causer des problèmes au stade de l'examen (car c'est une croyance commune). Cela étant dit, si vos communautés sont élevées (> 0,7), vous n'avez probablement pas de problème.
richiemorrisroe
Mes communautés sont 0,5 ou plus ...
Mitja
factors are "trying to correlate" with each otherest une formulation mystique. Les facteurs sont corrélés ou non en fonction de la façon dont nous les faisons pivoter (modéliser). Des "chargements croisés" assez élevés sont possibles avec des facteurs orthogonaux avec une variable ayant une communauté élevée.
ttnphns
1

J'ai le même problème maintenant. Voici un article qui recommande d'utiliser au moins 3 éléments par facteur. Dans des cas exceptionnels, cependant, vous pouvez utiliser des éléments par facteur (p.60). http://www.sajip.co.za/index.php/sajip/article/download/168/165 Mon cas semble être exceptionnel, car il n'y a que deux variables dans mon expérience sur le Web, qui fournissent des informations sur les stratégie et pouvoir stratégique. Peut-être que cela pourrait aussi vous aider à légitimer l'utilisation de 2 éléments pour certains facteurs.

eugentango
la source
1
Ce site Web contient un certain nombre de références prenant en charge au moins trois variables par règle de facteur: encorewiki.org/display/~nzhao/…