Analyse factorielle des questionnaires composés d'éléments Likert

17

J'avais l'habitude d'analyser des éléments d'un point de vue psychométrique. Mais maintenant, j'essaie d'analyser d'autres types de questions sur la motivation et d'autres sujets. Ces questions sont toutes sur des échelles de Likert. Ma pensée initiale était d'utiliser l'analyse factorielle, car les questions sont supposées refléter certaines dimensions sous-jacentes.

  • Mais l'analyse factorielle est-elle appropriée?
  • Faut-il valider chaque question quant à sa dimensionnalité?
  • Existe-t-il un problème avec l'analyse factorielle des éléments similaires?
  • Existe-t-il de bons documents et méthodes sur la façon de mener une analyse factorielle sur Likert et d'autres éléments catégoriels?
pbneau
la source
Si je comprends bien, votre question englobe au moins deux sujets différents: (1) l'utilisation de l'AF dans les échelles d'attitude ou de motivation, et (2) comment gérer les schémas de réponses `` extrêmes '' (effets de plafond / plancher) dans de telles échelles?
chl

Réponses:

22

D'après ce que j'ai vu jusqu'à présent, FA est utilisé pour les éléments d'attitude comme pour d'autres types d'échelles de notation. Le problème résultant de la métrique utilisée (c'est-à-dire "les échelles de Likert doivent-elles vraiment être traitées comme des échelles numériques?") Est un débat de longue date, mais à condition de vérifier la distribution de réponse en forme de cloche, vous pouvez les traiter comme des mesures continues, sinon, vérifiez les modèles FA non linéaires ou la mise à l'échelle optimale ) peuvent être gérés par des modèles IRT polytmomes, tels que la réponse graduée, l'échelle de notation ou le modèle de crédit partiel. Les deux derniers peuvent être utilisés pour vérifier grossièrement si les distances de seuil, telles qu'utilisées dans les éléments de type Likert, sont une caractéristique du format de réponse (RSM) ou de l'élément particulier (PCM).

En ce qui concerne votre deuxième point, il est connu, par exemple, que les distributions de réponses dans les enquêtes d'attitude ou de santé diffèrent d'un pays à l'autre (par exemple, les Chinois ont tendance à mettre en évidence des modèles de réponse `` extrêmes '' par rapport à ceux venant des pays occidentaux, voir par exemple Song , X.-Y. (2007) Analysis of multi-sample structural equation models with applications to Quality of Life data, in Handbook of Latent Variable and Related Models , Lee, S.-Y. (Ed.), Pp 279-302, North -Hollande). Quelques méthodes pour gérer une telle situation du haut de ma tête:

  • utilisation de modèles log-linéaires (approche marginale) pour mettre en évidence un fort déséquilibre entre les groupes au niveau de l'item (les coefficients sont ensuite interprétés comme des risques relatifs plutôt que des cotes);
  • la méthode SEM multi-échantillon de Song citée ci-dessus (je ne sais pas s'ils travaillent plus sur cette approche, cependant).

Maintenant, le fait est que la plupart de ces approches se concentrent au niveau de l'élément (effet plafond / plancher, fiabilité réduite, statistiques d'ajustement des éléments, etc.), mais quand on s'intéresse à la façon dont les gens s'écartent de ce qui serait attendu d'un idéal ensemble d'observateurs / répondants, je pense que nous devons plutôt nous concentrer sur les indices d'ajustement de la personne.

χ2

Comme proposé par Eid et Zickar (2007), combinant un modèle de classe latente (pour isoler le groupe de répondants, par exemple ceux qui répondent toujours sur les catégories extrêmes par rapport aux autres) et un modèle IRT (pour estimer les paramètres des éléments et l'emplacement des personnes sur le latent trait dans les deux groupes) semble une bonne solution. D'autres stratégies de modélisation sont décrites dans leur article (par exemple le modèle HYBRID, voir également Holden et Book, 2009).

De même, les modèles de déploiement peuvent être utilisés pour faire face au style de réponse , qui est défini comme un modèle cohérent et indépendant du contenu de la catégorie de réponse (par exemple tendance à être d'accord avec toutes les déclarations). Dans les sciences sociales ou la littérature psychologique, c'est ce qu'on appelle le style de réponse extrême (ERS). Les références (1 à 3) peuvent être utiles pour se faire une idée de la façon dont elles se manifestent et de la façon dont elles peuvent être mesurées.

Voici une courte liste d'articles qui peuvent aider à progresser sur ce sujet:

  1. Hamilton, DL (1968). Attributs de personnalité associés à un style de réponse extrême . Bulletin psychologique , 69 (3) : 192-203.
  2. Greanleaf, EA (1992). Mesurer le style de réponse extrême. Opinion publique trimestrielle , 56 (3) : 328-351.
  3. de Jong, MG, Steenkamp, ​​J.-BEM, Fox, J.-P., et Baumgartner, H. (2008). Utilisation de la théorie de la réponse aux éléments pour mesurer le style de réponse extrême dans la recherche marketing: une enquête mondiale. Journal of marketing research , 45 (1) : 104-115.
  4. Morren, M., Gelissen, J. et Vermunt, JK (2009). Gérer le style de réponse extrême dans la recherche interculturelle: une approche d'analyse factorielle de classe latente restreinte
  5. Moors, G. (2003). Diagnostic du comportement de style de réponse au moyen d'une approche de facteur de classe latente. Les corrélations socio-démographiques des attitudes et perceptions des rôles sexospécifiques à l'égard de la discrimination ethnique ont été réexaminées. Qualité et quantité , 37 (3), 277-302.
  6. de Jong, MG Steenkamp JB, Fox, J.-P., et Baumgartner, H. (2008). Article Théorie de la réponse pour mesurer le style de réponse extrême dans la recherche marketing: une enquête mondiale. Journal of Marketing Research , 45 (1), 104-115.
  7. Javaras, KN ​​et Ripley, BD (2007). Un modèle de variable latente «dépliée» pour les données d'attitude Likert. JASA , 102 (478): 454-463.
  8. diapositives de Moustaki, Knott et Mavridis, Méthodes de détection des valeurs aberrantes dans les modèles à variables latentes
  9. Eid, M. et Zickar, MJ (2007). Détecter les styles de réponse et simuler les évaluations de personnalité et d'organisation par des modèles de Rasch mixtes. Dans von Davier, M. et Carstensen, CH (éd.), Multivariate and Mixture Distribution Rasch Models , pp. 255-270, Springer.
  10. Holden, RR et Book, AS (2009). Utilisation de la modélisation de classe hybride Rasch-latente pour améliorer la détection des faussaires sur un inventaire de personnalité. Personnalité et différences individuelles , 47 (3) : 185-190.
chl
la source
Liens brisés pour Hamilton (1968) et Morren, Gelissen et Vermunt (2009) ... bummer! Impossible de trouver des sources alternatives avec Google Scholar non plus (je n'ai pas encore essayé l'ancien Google classique).
Nick Stauner
13

L'analyse factorielle exploratoire (EPT) est appropriée (psychométriquement et autrement) pour examiner dans quelle mesure on peut expliquer les corrélations entre plusieurs éléments en inférant l'influence commune d'un (des) facteur (s) non mesuré (c.-à-d. Latent). Si ce n'est pas votre intention spécifique, envisagez d'autres analyses, par exemple:

  • Modélisation linéaire générale (p. Ex. Régression multiple, corrélation canonique ou OVA (M) AN (C))
  • Analyse factorielle confirmatoire (CFA) ou analyse latente des traits / classes / profils
  • Équation structurelle (SEM) / modélisation des moindres carrés partiels

La dimensionnalité est le premier problème que l'EPT peut résoudre. Vous pouvez examiner les valeurs propres de la matrice de covariance (comme en produisant un tracé d'éboulis via l'EFA) et effectuer une analyse parallèle pour résoudre la dimensionnalité de vos mesures. (Voir également quelques excellents conseils et suggestions alternatives de William Revelle .) Vous devez le faire soigneusement avant d'extraire un nombre limité de facteurs et de les faire pivoter dans l'EFA, ou avant d'adapter un modèle avec un nombre spécifique de facteurs latents à l'aide de CFA, SEM ou similaires. Si une analyse parallèle indique une multidimensionnalité, mais que votre (premier) facteur général l'emporte largement sur tous les autres (c'est-à-dire qu'il a de loin la valeur propre la plus élevée / explique la majorité de la variance dans vos mesures), envisagez une analyse bifactorielle (Gibbons et Hedeker, 1992;Reise, Moore et Haviland, 2010 ) .

De nombreux problèmes se posent dans l'EFA et la modélisation des facteurs latents des notes de l'échelle de Likert. Les échelles de Likert produisent des données ordinales (c.-à-d. Catégoriques, polytomiques, ordonnées) et non des données continues. L'analyse factorielle suppose généralement que toute entrée de données brutes est continue, et les gens effectuent souvent des analyses factorielles des matrices des corrélations produit-moment de Pearson, qui ne conviennent qu'aux données continues. Voici une citation de Reise et ses collègues (2010) :

Les techniques analytiques de facteur de confirmation ordinaires ne s'appliquent pas aux données dichotomiques ou polytomiques (Byrne, 2006) . Au lieu de cela, des procédures d'estimation spéciales sont requises (Wirth et Edwards, 2007) . Il existe essentiellement trois options pour travailler avec des données de réponse d'élément polytomique. La première consiste à calculer une matrice polychorique puis à appliquer des méthodes analytiques factorielles standard (voir Knol et Berger, 1991) . Une deuxième option consiste à utiliser l'analyse factorielle complète des éléments (Gibbons et Hedeker, 1992) . La troisième consiste à utiliser des procédures d'estimation des informations limitées conçues spécifiquement pour les données ordonnées telles que les moindres carrés pondérés avec ajustement de la moyenne et de la variance (MPLUS; Muthén et Muthén, 2009) .

Je recommanderais de combiner la première et la troisième approche (c.-à-d., Utiliser l'estimation des moindres carrés pondérés en diagonale sur une matrice de corrélation polychorique), basée sur la discussion de Wang et Cunningham (2005) des problèmes avec les alternatives typiques:

Lorsqu'une analyse factorielle confirmatoire a été menée avec des données ordinales non normales utilisant le maximum de vraisemblance et basées sur des corrélations de moment-produit de Pearson, les estimations des paramètres à la baisse produites dans cette étude étaient conformes aux résultats d'Olsson (1979) . En d'autres termes, l'ampleur de la non-normalité dans les variables ordinales observées est un déterminant majeur de la précision des estimations des paramètres.

Les résultats corroborent également les conclusions de Babakus et al. (1987) . Lorsqu'une estimation du maximum de vraisemblance est utilisée avec une matrice d'entrée de corrélation polychorique dans les analyses de facteurs de confirmation, les solutions ont tendance à entraîner des valeurs de chi carré inacceptables et donc significatives, ainsi que des statistiques d'ajustement médiocres.

La question demeure de savoir si les chercheurs devraient utiliser des estimateurs des moindres carrés pondérés ou des moindres carrés pondérés en diagonale pour estimer les modèles d'équations structurelles avec des données catégorielles non normales. Ni l'estimation des moindres carrés pondérés ni celle des moindres carrés pondérés en diagonale ne font d'hypothèses sur la nature de la distribution des variables et les deux méthodes produisent des résultats valides asymptotiquement. Néanmoins, comme l'estimation des moindres carrés pondérés est basée sur des moments de quatrième ordre, cette approche entraîne fréquemment des problèmes pratiques et est très exigeante en termes de calcul. Cela signifie que l'estimation des moindres carrés pondérés peut manquer de robustesse lorsqu'elle est utilisée pour évaluer des modèles de moyenne, c'est-à-dire avec 10 indicateurs, à une grande taille et des tailles d'échantillon petites à modérées.

Il n'est pas clair pour moi si la même préoccupation avec l'estimation des moindres carrés pondérés s'applique à l'estimation DWLS; quoi qu'il en soit, les auteurs recommandent cet estimateur. Au cas où vous n'en auriez pas déjà les moyens:

  • R (R Core Team, 2012) est gratuit. Vous aurez besoin d'une ancienne version (par exemple, 2.15.2) pour ces packages:
    • Le psychpackage (Revelle, 2013) contient la polychoricfonction.
      • La fa.parallelfonction peut aider à identifier le nombre de facteurs à extraire.
    • Le lavaanpackage (Rosseel, 2012) propose une estimation DWLS pour l'analyse des variables latentes.
    • Le semToolspaquet contient les efaUnrotate, orthRotateet les oblqRotatefonctions.
    • Le mirtpackage (Chalmers, 2012) offre des alternatives prometteuses en utilisant la théorie de la réponse aux items.

J'imagine que Mplus (Muthén & Muthén, 1998-2011) fonctionnerait aussi, mais la version de démonstration gratuite ne pourra pas accueillir plus de six mesures, et la version sous licence n'est pas bon marché. Cela peut valoir la peine si vous pouvez vous le permettre; les gens adorent Mplus , et le service client des Muthéns via leurs forums est incroyable!

Comme indiqué ci-dessus, l'estimation DWLS surmonte le problème des violations des hypothèses de normalité (à la fois univariées et multivariées), qui est un problème très courant et presque omniprésent dans les données de notation de l'échelle de Likert. Cependant, ce n'est pas nécessairement un problème pragmatique conséquent; la plupart des méthodes ne sont pas trop sensibles aux (petites biais) de petites violations (cf. Les tests de normalité sont-ils «essentiellement inutiles»? ). La réponse de @ chl à cette question soulève également des points et suggestions plus importants et excellents concernant les problèmes de style de réponse extrême; certainement un problème avec les notes d'échelle de Likert et d'autres données subjectives.


Références
· Babakus, E., Ferguson, JCE et Jöreskog, KG (1987). La sensibilité de l'analyse confirmatoire du facteur de probabilité maximale aux violations de l'échelle de mesure et des hypothèses de distribution. Journal of Marketing Research, 24 , 222-228.
· Byrne, BM (2006). Modélisation d'équations structurelles avec EQS. Mahwah, NJ: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: un package de théorie de réponse aux éléments multidimensionnels pour l'environnement R. Journal of Statistical Software, 48 (6), 1–29. Extrait de http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD et Hedeker, DR (1992). Analyse bi-factorielle des éléments d'information complète. Psychometrika, 57 , 423–436.
· Knol, DL et Berger, MPF (1991). Comparaison empirique entre l'analyse factorielle et les modèles de réponse aux éléments multidimensionnels. Multivariate Behavioral Research, 26 , 457–477.
· Muthén, LK et Muthén, BO (1998-2011). Guide de l'utilisateur Mplus (6e éd.). Los Angeles, Californie: Muthén & Muthén.
· Muthén, LK et Muthén, BO (2009). Mplus (version 4.00). [Logiciel]. Los Angeles, CA: auteur. URL: http://www.statmodel.com .
· Olsson, U. (1979). Estimations du maximum de vraisemblance pour le coefficient de corrélation polychorique. Psychometrika, 44 , 443–460.
·R Core Team. (2012). R: Un langage et un environnement pour le calcul statistique. Fondation R pour le calcul statistique, Vienne, Autriche. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM et Haviland, MG (2010). Modèles bifactoriels et rotations: exploration de la mesure dans laquelle les données multidimensionnelles produisent des scores d'échelle univoques. Journal of Personality Assessment, 92 (6), 544–559. Extrait de http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). psych: Procédures pour la personnalité et la recherche psychologique. Northwestern University, Evanston, Illinois, États-Unis. Extrait de http://CRAN.R-project.org/package=psych . Version = 1.3.2.
· Rosseel, Y. (2012). lavaan: Un package R pour la modélisation des équations structurelles. Journal of Statistical Software, 48 (2), 1–36. Extrait de http://www.jstatsoft.org/v48/i02/ .
· Wang, WC et Cunningham, EG (2005). Comparaison d'autres méthodes d'estimation dans les analyses factorielles confirmatoires du questionnaire général sur la santé. Rapports psychologiques, 97 , 3–10.
· Wirth, RJ et Edwards, MC (2007). Analyse factorielle des éléments: approches actuelles et orientations futures. Psychological Methods, 12 , 58–79. Extrait de http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .

Nick Stauner
la source
(+11) Je ne sais pas comment j'ai raté votre réponse!
chl
Ha! Merci! Celui-ci est assis depuis un moment. J'ai supposé que c'était juste un peu trop long ou obscur, ou peut-être dépendant de nouvelles méthodes qui étaient plus controversées que je ne le pensais. On dirait que je ne savais pas encore comment utiliser les balises pour les noms d'utilisateur.
Nick Stauner