J'avais l'habitude d'analyser des éléments d'un point de vue psychométrique. Mais maintenant, j'essaie d'analyser d'autres types de questions sur la motivation et d'autres sujets. Ces questions sont toutes sur des échelles de Likert. Ma pensée initiale était d'utiliser l'analyse factorielle, car les questions sont supposées refléter certaines dimensions sous-jacentes.
- Mais l'analyse factorielle est-elle appropriée?
- Faut-il valider chaque question quant à sa dimensionnalité?
- Existe-t-il un problème avec l'analyse factorielle des éléments similaires?
- Existe-t-il de bons documents et méthodes sur la façon de mener une analyse factorielle sur Likert et d'autres éléments catégoriels?
Réponses:
D'après ce que j'ai vu jusqu'à présent, FA est utilisé pour les éléments d'attitude comme pour d'autres types d'échelles de notation. Le problème résultant de la métrique utilisée (c'est-à-dire "les échelles de Likert doivent-elles vraiment être traitées comme des échelles numériques?") Est un débat de longue date, mais à condition de vérifier la distribution de réponse en forme de cloche, vous pouvez les traiter comme des mesures continues, sinon, vérifiez les modèles FA non linéaires ou la mise à l'échelle optimale ) peuvent être gérés par des modèles IRT polytmomes, tels que la réponse graduée, l'échelle de notation ou le modèle de crédit partiel. Les deux derniers peuvent être utilisés pour vérifier grossièrement si les distances de seuil, telles qu'utilisées dans les éléments de type Likert, sont une caractéristique du format de réponse (RSM) ou de l'élément particulier (PCM).
En ce qui concerne votre deuxième point, il est connu, par exemple, que les distributions de réponses dans les enquêtes d'attitude ou de santé diffèrent d'un pays à l'autre (par exemple, les Chinois ont tendance à mettre en évidence des modèles de réponse `` extrêmes '' par rapport à ceux venant des pays occidentaux, voir par exemple Song , X.-Y. (2007) Analysis of multi-sample structural equation models with applications to Quality of Life data, in Handbook of Latent Variable and Related Models , Lee, S.-Y. (Ed.), Pp 279-302, North -Hollande). Quelques méthodes pour gérer une telle situation du haut de ma tête:
Maintenant, le fait est que la plupart de ces approches se concentrent au niveau de l'élément (effet plafond / plancher, fiabilité réduite, statistiques d'ajustement des éléments, etc.), mais quand on s'intéresse à la façon dont les gens s'écartent de ce qui serait attendu d'un idéal ensemble d'observateurs / répondants, je pense que nous devons plutôt nous concentrer sur les indices d'ajustement de la personne.
Comme proposé par Eid et Zickar (2007), combinant un modèle de classe latente (pour isoler le groupe de répondants, par exemple ceux qui répondent toujours sur les catégories extrêmes par rapport aux autres) et un modèle IRT (pour estimer les paramètres des éléments et l'emplacement des personnes sur le latent trait dans les deux groupes) semble une bonne solution. D'autres stratégies de modélisation sont décrites dans leur article (par exemple le modèle HYBRID, voir également Holden et Book, 2009).
De même, les modèles de déploiement peuvent être utilisés pour faire face au style de réponse , qui est défini comme un modèle cohérent et indépendant du contenu de la catégorie de réponse (par exemple tendance à être d'accord avec toutes les déclarations). Dans les sciences sociales ou la littérature psychologique, c'est ce qu'on appelle le style de réponse extrême (ERS). Les références (1 à 3) peuvent être utiles pour se faire une idée de la façon dont elles se manifestent et de la façon dont elles peuvent être mesurées.
Voici une courte liste d'articles qui peuvent aider à progresser sur ce sujet:
la source
L'analyse factorielle exploratoire (EPT) est appropriée (psychométriquement et autrement) pour examiner dans quelle mesure on peut expliquer les corrélations entre plusieurs éléments en inférant l'influence commune d'un (des) facteur (s) non mesuré (c.-à-d. Latent). Si ce n'est pas votre intention spécifique, envisagez d'autres analyses, par exemple:
La dimensionnalité est le premier problème que l'EPT peut résoudre. Vous pouvez examiner les valeurs propres de la matrice de covariance (comme en produisant un tracé d'éboulis via l'EFA) et effectuer une analyse parallèle pour résoudre la dimensionnalité de vos mesures. (Voir également quelques excellents conseils et suggestions alternatives de William Revelle .) Vous devez le faire soigneusement avant d'extraire un nombre limité de facteurs et de les faire pivoter dans l'EFA, ou avant d'adapter un modèle avec un nombre spécifique de facteurs latents à l'aide de CFA, SEM ou similaires. Si une analyse parallèle indique une multidimensionnalité, mais que votre (premier) facteur général l'emporte largement sur tous les autres (c'est-à-dire qu'il a de loin la valeur propre la plus élevée / explique la majorité de la variance dans vos mesures), envisagez une analyse bifactorielle (Gibbons et Hedeker, 1992;Reise, Moore et Haviland, 2010 ) .
De nombreux problèmes se posent dans l'EFA et la modélisation des facteurs latents des notes de l'échelle de Likert. Les échelles de Likert produisent des données ordinales (c.-à-d. Catégoriques, polytomiques, ordonnées) et non des données continues. L'analyse factorielle suppose généralement que toute entrée de données brutes est continue, et les gens effectuent souvent des analyses factorielles des matrices des corrélations produit-moment de Pearson, qui ne conviennent qu'aux données continues. Voici une citation de Reise et ses collègues (2010) :
Je recommanderais de combiner la première et la troisième approche (c.-à-d., Utiliser l'estimation des moindres carrés pondérés en diagonale sur une matrice de corrélation polychorique), basée sur la discussion de Wang et Cunningham (2005) des problèmes avec les alternatives typiques:
Il n'est pas clair pour moi si la même préoccupation avec l'estimation des moindres carrés pondérés s'applique à l'estimation DWLS; quoi qu'il en soit, les auteurs recommandent cet estimateur. Au cas où vous n'en auriez pas déjà les moyens:
2.15.2
) pour ces packages:psych
package (Revelle, 2013) contient lapolychoric
fonction.fa.parallel
fonction peut aider à identifier le nombre de facteurs à extraire.lavaan
package (Rosseel, 2012) propose une estimation DWLS pour l'analyse des variables latentes.semTools
paquet contient lesefaUnrotate
,orthRotate
et lesoblqRotate
fonctions.mirt
package (Chalmers, 2012) offre des alternatives prometteuses en utilisant la théorie de la réponse aux items.J'imagine que Mplus (Muthén & Muthén, 1998-2011) fonctionnerait aussi, mais la version de démonstration gratuite ne pourra pas accueillir plus de six mesures, et la version sous licence n'est pas bon marché. Cela peut valoir la peine si vous pouvez vous le permettre; les gens adorent Mplus , et le service client des Muthéns via leurs forums est incroyable!
Comme indiqué ci-dessus, l'estimation DWLS surmonte le problème des violations des hypothèses de normalité (à la fois univariées et multivariées), qui est un problème très courant et presque omniprésent dans les données de notation de l'échelle de Likert. Cependant, ce n'est pas nécessairement un problème pragmatique conséquent; la plupart des méthodes ne sont pas trop sensibles aux (petites biais) de petites violations (cf. Les tests de normalité sont-ils «essentiellement inutiles»? ). La réponse de @ chl à cette question soulève également des points et suggestions plus importants et excellents concernant les problèmes de style de réponse extrême; certainement un problème avec les notes d'échelle de Likert et d'autres données subjectives.
Références
· Babakus, E., Ferguson, JCE et Jöreskog, KG (1987). La sensibilité de l'analyse confirmatoire du facteur de probabilité maximale aux violations de l'échelle de mesure et des hypothèses de distribution. Journal of Marketing Research, 24 , 222-228.
· Byrne, BM (2006). Modélisation d'équations structurelles avec EQS. Mahwah, NJ: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: un package de théorie de réponse aux éléments multidimensionnels pour l'environnement R. Journal of Statistical Software, 48 (6), 1–29. Extrait de http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD et Hedeker, DR (1992). Analyse bi-factorielle des éléments d'information complète. Psychometrika, 57 , 423–436.
· Knol, DL et Berger, MPF (1991). Comparaison empirique entre l'analyse factorielle et les modèles de réponse aux éléments multidimensionnels. Multivariate Behavioral Research, 26 , 457–477.
· Muthén, LK et Muthén, BO (1998-2011). Guide de l'utilisateur Mplus (6e éd.). Los Angeles, Californie: Muthén & Muthén.
· Muthén, LK et Muthén, BO (2009). Mplus (version 4.00). [Logiciel]. Los Angeles, CA: auteur. URL: http://www.statmodel.com .
· Olsson, U. (1979). Estimations du maximum de vraisemblance pour le coefficient de corrélation polychorique. Psychometrika, 44 , 443–460.
·R Core Team. (2012). R: Un langage et un environnement pour le calcul statistique. Fondation R pour le calcul statistique, Vienne, Autriche. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM et Haviland, MG (2010). Modèles bifactoriels et rotations: exploration de la mesure dans laquelle les données multidimensionnelles produisent des scores d'échelle univoques. Journal of Personality Assessment, 92 (6), 544–559. Extrait de http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). psych: Procédures pour la personnalité et la recherche psychologique. Northwestern University, Evanston, Illinois, États-Unis. Extrait de http://CRAN.R-project.org/package=psych . Version = 1.3.2.
· Rosseel, Y. (2012). lavaan: Un package R pour la modélisation des équations structurelles. Journal of Statistical Software, 48 (2), 1–36. Extrait de http://www.jstatsoft.org/v48/i02/ .
· Wang, WC et Cunningham, EG (2005). Comparaison d'autres méthodes d'estimation dans les analyses factorielles confirmatoires du questionnaire général sur la santé. Rapports psychologiques, 97 , 3–10.
· Wirth, RJ et Edwards, MC (2007). Analyse factorielle des éléments: approches actuelles et orientations futures. Psychological Methods, 12 , 58–79. Extrait de http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .
la source
Juste une petite note que vous voudrez peut-être regarder la corrélation polychorique avec l'analyse factorielle plutôt que la matrice de corrélation / covariance traditionnelle.
http://www.john-uebersax.com/stat/sem.htm
la source