Modélisation d'équations structurelles de mesures répétées

10

J'ai besoin d'analyser un ensemble de données de données de réadaptation clinique. Je m'intéresse aux relations fondées sur des hypothèses entre les «intrants» quantifiés (quantité de thérapie) et les changements de l'état de santé. Bien que l'ensemble de données soit relativement petit (n ~ 70), nous avons des données répétées reflétant des changements temporels dans les deux. Je connais la modélisation des effets mixtes non linéaires dans R, mais je suis intéressé par les relations "causales" potentielles entre l'entrée et la sortie ici et je considère donc les applications de mesures répétées du SEM

J'apprécierais des conseils sur lequel, si l'un des packages SEM pour R (sam, lavaan, openmx?) Est le mieux adapté aux données de mesures répétées, et en particulier des recommandations pour les manuels (existe-t-il un "Pinheiro et Bates" du domaine?) .

RobF
la source
2
Pourquoi pensez-vous avoir besoin de SEM, du tout? Si vous avez entendu le battage médiatique selon lequel SEM résout tous les problèmes causaux, c'est un surhype, seules les expériences aléatoires idéales le font. Voir la référence que j'ai donnée dans ma réponse ci-dessous.
StasK
1
Quand vous dites n ~ 70, voulez-vous dire 70 patients mesurés dans le temps, ou 70 mesures (disons 7 patients à 10 moments différents)? J'apprends juste SEM, mais une chose que j'ai remarquée jusqu'à présent est qu'il suppose de grands ensembles de données (ils parlent de 200+ ou plus), donc vous pourriez vous frustrer / vous tromper.
Wayne

Réponses:

5

Je pense que vous voulez un modèle de courbe de croissance latente. Alors que je ne l'ai utilisé que LISRELpour cela, le lavaan package documentationindique qu'il peut être utilisé pour s'adapter à ce type de modèle.

Je ne connais aucun livre spécialisé dans ce sujet, le livre sur lequel je travaille pour SEM couvre un éventail de méthodes. Peut-être que quelqu'un d'autre peut répondre à cet aspect de votre question.

Michelle
la source
2
(+1) En effet, les modèles de courbe de croissance et de mélange LV sont parmi certains des sujets «chauds» en SEM ou en psychométrie; ils sont traités dans certains livres récents, comme Latent Variable Mixture Models (Hancock & Samuelsen, 2008). J'ai d'autres articles sur ma liste TOBEREADFORTOOLONG, et je recommanderais de regarder les travaux de Múthen et coll., En conjonction avec ce que le logiciel Mplus offre à cette fin particulière . Si je trouve du temps pour relire la littérature et comparer lavaan/ Mx à Mplus, je posterai moi-même une réponse.
chl
Ce serait bien, car je viens d'apprendre les modèles de courbe de croissance latente, et ils sont vraiment un modèle tout à fait unique par rapport à d'autres types de SEM.
Michelle
4

Non, il n'y a pas de "Pinheiro et Bates". Vous pouvez trouver un certain nombre de livres intitulés "SEM utilisant AMOS / LISREL / Mplus", mais je n'en connais aucun utilisant R. Le meilleur livre, mathématiquement parlant, sur SEM est toujours Bollen (1989) . Il est écrit par un sociologue plutôt que par un biostatisticien (bien que très bon!), Et s'adresse donc aux spécialistes des sciences sociales, et contient peu de références aux logiciels (et vous ne voulez pas du tout il y a un quart de siècle) . Bollen a également co-écrit récemment un bon article sur la causalité avec Judea Pearl, voir http://ftp.cs.ucla.edu/pub/stat_ser/r393.pdf . Pour autant que je sache , Mulaik (2009) devrait aussi être bon, mais il est écrit par un psychologue pour des psychologues.

Je ne pense pas que le paquet sem soit suffisamment flexible pour exécuter ce genre de choses. OpenMx peut traiter des données ordinales (et donc des résultats binaires), mais je ne pense pas que lavaan puisse le faire.

Le logiciel que vous trouverez conceptuellement le plus facile à gérer pourrait être GLLAMM , un package écrit pour Stata . Vu dans un sens, il s'agit essentiellement d'une incarnation de Stata nlme. Avec un ajustement supplémentaire (permettant aux coefficients des effets aléatoires de varier en fonction des valeurs d'autres variables), il devient un package de modélisation de variable latente. Tout cela est décrit dans Skrondal et Rabe-Hesketh (2004) ... qui est un excellent livre en soi que vous voudriez avoir même si vous le faites nlme.

StasK
la source
(+1) Belles références. (À propos gllamm, vu d'une autre manière - du point de vue d'un psychométricien habitué aux modèles IRT: c'est horriblement lent :-)
chl
@chl, écrivez votre propre probabilité;). C'est ce que j'ai fait polychoric, par exemple, quand j'en avais besoin.
StasK
2

Comme vous semblez à l'aise avec les modèles mixtes linéaires généralisés et que vous ne semblez pas impliquer que les variables latentes vous intéressent, vous voudrez peut-être adopter une approche par morceaux lmerque vous pourrez ensuite évaluer à l'aide d'un test D-Sep. Voir Shipley, B. (2009). Analyse du chemin de confirmation dans un contexte multiniveaux généralisé. Ecology, Ecology, 90, 363–368. http://dx.doi.org/10.1890/08-1034.1 pour un exemple. Il fournit également le code R dans l'annexe pour savoir comment calculer le test de séparation D.

Si vous voulez vraiment vous lancer dans la modélisation de variables latentes et SEM en utilisant le maximum de vraisemblance, consultez http://lavaan.org - il y a un excellent tutoriel qui couvre ses capacités ainsi qu'une section sur les modèles de courbe de croissance latente qui pourrait bien être ce que vous êtes après.

jebyrnes
la source