Introduction à la modélisation d'équations structurelles

24

Des collègues me demandent de l'aide à ce sujet, que je ne connais pas vraiment. Ils ont fait des hypothèses sur le rôle de certaines variables latentes dans une étude, et un arbitre leur a demandé de formaliser cela en SEM. Comme ce dont ils ont besoin ne semble pas trop difficile, je pense que je vais essayer ... pour l'instant, je suis juste à la recherche d'une bonne introduction au sujet!

Google n'était pas vraiment mon ami à ce sujet. Merci d'avance...

PS: J'ai lu Modélisation d'équations structurelles avec le package sem dans R par John Fox, et ce texte du même auteur. Je pense que cela peut être suffisant pour mon objectif, de toute façon toute autre référence est la bienvenue.

Elvis
la source
Voulez-vous des manuels clés sur le SEM dans une perspective appliquée, ou des manuels plus généraux et formels?
chl
@chl Merci de votre attention. Maintenant que j'ai acquis les bases, j'aimerais voir une description explicite de la probabilité et des conditions d'identification. Quelque chose au sujet des indicateurs binaires et ordinaux serait également le bienvenu: Fox utilise des corrélations polychoriques, ce qui semble simple et efficace, mais des solutions évidemment plus complexes sont possibles ... J'ai trouvé des articles intéressants mais je manque de temps pour entamer une recherche bibliographique approfondie; un manuel ou un «document de référence» serait le bienvenu.
Elvis

Réponses:

18

J'irais chercher des articles de Múthen et Múthen, qui sont les auteurs du logiciel Mplus , en particulier

  1. Múthen, BO (1984). Un modèle d'équation structurelle générale avec des indicateurs dichotomiques, catégoriels ordonnés et latents continus . Psychometrika , 49, 115–132.
  2. Muthén, B., du Toit, SHC & Spisic, D. (1997). Inférence robuste utilisant des moindres carrés pondérés et des équations d'estimation quadratiques dans la modélisation de variables latentes avec des résultats catégoriques et continus. Rapport technique non publié.

(Disponible en PDF à partir d'ici: Moindres carrés pondérés pour les variables catégorielles .)

Il y a beaucoup plus à voir sur le wiki Mplus, par exemple les résultats WLS contre WLSMV avec des données ordinales ; les deux auteurs sont très réactifs et fournissent toujours des réponses détaillées accompagnées de références lorsque cela est possible. Quelques comparaisons des moindres carrés pondérés robustes par rapport aux méthodes basées sur ML d'analyse des matrices de corrélation polychoriques ou polysériennes peuvent être trouvées dans:

Lei, PW (2009). Évaluation des méthodes d'estimation des données ordinales dans la modélisation d'équations structurelles . Qualité et quantité , 43, 495–507.

Pour d'autres développements mathématiques, vous pouvez consulter:

Jöreskog, KG (1994) Sur l'estimation des corrélations polychoriques et leur matrice de covariance asymptotique . Psychometrika , 59 (3), 381-389. (Voir aussi les articles de SY Lee .)

Sophia Rabe-Hesketh et ses collègues ont également de bons articles sur SEM. Quelques références pertinentes:

  1. Rabe-Hesketh, S. Skrondal, A., et Pickles, A. (2004b). Modélisation d'équations structurelles multiniveaux généralisées . Psychometrika , 69, 167-190.
  2. Skrondal, A. et Rabe-Hesketh, S. (2004). Modélisation de variables latentes généralisées: modèles d'équations multiniveaux, longitudinaux et structurels . Chapman & Hall / CRC, Boca Raton, Floride. (Ceci est le manuel de référence pour comprendre / travailler avec Stata gllamm .)

D'autres bonnes ressources sont probablement répertoriées sur l'excellent site Web de John Uebersax, en particulier Introduction to the Tetrachoric and Polychoric Correlation Coefficients . Étant donné que vous êtes également intéressé par le travail appliqué, je suggère de jeter un oeil à OpenMx (encore un autre logiciel pour modéliser la structure de covariance) et lavaan (qui vise à fournir des résultats similaires à ceux d'EQS ou de Mplus), tous deux disponibles sous R.

chl
la source
Merci beaucoup pour toutes ces références, y compris les packages R.
Elvis
12

Bien que tangente à vos objectifs à ce stade, si vous continuez sur des projets utilisant des variables latentes, je vous suggère fortement de lire Measuring the Mind de Denny Boorsboom . Ne vous laissez pas berner par le titre, il s'agit principalement d'un essai détaillé sur la logique des variables latentes, et d'une large critique de la théorie des tests classiques. Je dirais que c'est une lecture nécessaire si vous utilisez des variables latentes dans un cadre longitudinal. Il ne s'agit que de la logique des variables latentes, il n'a rien à propos de l'estimation réelle des modèles.


Revenez avec vos expériences, j'ai déjà certaines des références données ici, bien que j'aimerais aussi étendre ma bibliothèque. FWIW, les équations structurelles de Ken Bollen avec des variables latentes étaient les suivantes sur ma liste de lecture (bien que cela ne soit basé que sur mon opinion de son travail universitaire).

En plus de cela, je dirais que j'aime aussi le travail de Bengt Muthén. Le logiciel MPlus est incroyablement populaire et vous pouvez voir tous les types d'analyses qui peuvent être effectuées sur le site Web Mplus ( lien vers le guide de l'utilisateur ). Il a également une série de publications en mp3 de son cours sur l'analyse statistique avec des variables latentes à l'UCLA. Je ne les ai pas tous écoutés, mais je soupçonne que tous sont des introductions approfondies à n'importe quel sujet particulier couvert pour cette conférence de cette semaine.

Andy W
la source
3
(+1) Je suis vraiment un grand fan des papiers de Denny Boorsboom .
chl
Le livre Borsboom couvre-t-il la théorie de la réponse aux éléments? J'essaie de faire du travail d'investigation en utilisant l'analyse de Rasch sur les enquêtes en sciences sociales, et je suis intéressé à ajouter des livres à ma bibliothèque qui critiquent le CTT et recommandent l'IRT pour le travail en sciences sociales.
Michelle
@Michelle, le livre Borsboom n'est pas spécifique aux façons dont nous représentons les variables latentes (soit par l'IRT ou d'autres modèles de type analyse factorielle). Il s'agit simplement d'un essai détaillé sur ce que sont les variables latentes, et aussi en grande partie sur la façon dont CTT est stupide en tant qu'entreprise scientifique.
Andy W
@AndyW merci pour les informations supplémentaires, il semble que le livre sera toujours un bon ajout à ma bibliothèque.
Michelle
@Michelle CTT est souvent utilisé comme étape analytique préliminaire (voir par exemple Bechger et al., Using Classical Test Theory in Combination with Item Response Theory , APM 2003 27: 319) pendant la construction de l'échelle, afin d'éliminer les éléments qui se comportent mal. La principale critique porte sur le fait que les statistiques CTT dépendent de l'échantillon (et contiennent une définition axiomatique du score réel ), mais certains modèles IRT ne sont pas vraiment des «modèles de mesure», pour certains auteurs.
chl
5

J'étudie SEM en ce moment, en utilisant LISREL. Nous utilisons ces deux livres:

  1. Guide du débutant sur la modélisation d'équations structurelles
  2. Nouveaux développements et techniques dans la modélisation d'équations structurelles

Le Dr Schumaker est l'instructeur de mon cours. Le premier livre est vraiment bon pour introduire SEM, car il vous guide tout au long du processus de spécification, d'identification, etc. Bien qu'il soit basé sur le LISRELlogiciel, je m'attendrais à ce que les méthodes générales et l'interprétation des résultats soient indépendantes du logiciel.

Michelle
la source
2
Je recommanderais les modèles de variables latentes de Loehlin : une introduction à l'analyse des facteurs, des trajectoires et des équations structurelles (2003, 4e éd., Lawrence Erlbaum Associates). C'est un très bon livre avec beaucoup d'illustrations et de références.
chl
Le premier livre est excellent pour vous guider dans les décisions sur la façon de découper les variables de vos résultats SEM, de sorte que vous vous retrouvez avec un modèle correctement spécifié. Dans le cours que je fais, je passe beaucoup de temps à essayer de trouver la spécification de modèle correcte, et nous utilisons des ensembles de données illustratifs. La spécification -> identification -> estimation -> test -> processus de modification est bien couverte dans le premier livre.
Michelle
4

Le livre de Kline est excellent. Pour une introduction rapide sous forme de document, voir

Gefen, D. 2000. Modélisation et régression d'équations structurelles: Lignes directrices pour la pratique de la recherche. PCSRA. Volume 4. http://aisel.aisnet.org/cais/vol4/iss1/7/

Hox, JJ et Bechger, TM Une introduction à la modélisation d'équations structurelles. Revue des sciences de la famille. 11: 354-373. http://joophox.net/publist/semfamre.pdf

Lei, PW et Wu, Q. 2007. Introduction à la modélisation d'équations structurelles: problèmes et considérations pratiques. Mesure de l'éducation: enjeux et pratiques. http://dx.doi.org/10.1111/j.1745-3992.2007.00099.x

Grace, J. 2010. Modélisation d'équations structurelles pour les études d'observation. Le Journal of Wildlife Management. 72: 14-22 http://dx.doi.org/10.2193/2007-307

Voir aussi http://lavaan.org

jebyrnes
la source
1

Jarrett Byrnes (jebyrnes ici) a également son matériel de cours d'introduction SEM d'une semaine affiché ici: http://byrneslab.net/teaching/sem/

Le cours est destiné aux chercheurs appliquant les SEM aux données biologiques et écologiques, mais couvre les introductions générales aux concepts SEM, au code R et aux exemples, il est donc susceptible d'être utile aux autres. J'ai trouvé le matériel très utile pour commencer avec presque aucune connaissance de l'approche.

DirtStats
la source