Le contexte
Je veux planter le décor avant d'étendre quelque peu la question.
J'ai des données longitudinales, des mesures sont prises sur des sujets environ tous les 3 mois, le résultat principal est numérique (comme en continu à 1dp) dans la plage de 5 à 14, la masse (de tous les points de données) étant comprise entre 7 et 10. Si je fais un l'intrigue des spaghettis (avec l'âge sur l'axe des x et une ligne pour chaque personne), c'est évidemment un gâchis car j'ai> 1500 sujets, mais il y a une voie claire vers des valeurs plus élevées avec un âge accru (et cela est connu).
La question plus large: ce que nous aimerions faire, c'est d'abord être en mesure d'identifier les groupes de tendance (ceux qui commencent haut et restent haut, ceux qui commencent bas et restent bas, ceux qui commencent bas et augmentent jusqu'à etc.) et ensuite nous pouvons examiner les facteurs individuels associés à l'appartenance à un «groupe de tendance».
Ma question ici concerne spécifiquement la première partie, le regroupement par tendance.
Question
- Comment regrouper les trajectoires longitudinales individuelles?
- Quel logiciel conviendrait pour l'implémenter?
J'ai examiné Proc Traj dans SAS et M-Plus suggéré par un collègue, que j'examine, mais j'aimerais savoir ce que les autres pensent à ce sujet.
la source
kml
package - qui semble fournir les fonctionnalités dont vous avez besoin. Le papier dans JoSS le décrit en détail. Aussikml3d
&kmlShape
pourrait être d'intérêt.Réponses:
J'ai utilisé le Mfuzz dans R pour regrouper des ensembles de données de puces à ADN. Mfuzz utilise le "soft-clustering". Fondamentalement, les individus peuvent apparaître dans plus d'un groupe.
Comme @Andy le fait remarquer dans le commentaire, l'article original utilise des données CTN. Cependant, je soupçonne que cela devrait fonctionner correctement pour vos données discrètes. D'autant plus que vous explorez simplement l'ensemble de données. Voici un exemple rapide dans R:
Donne l'intrigue suivante:
la source
Je m'attends à ce qu'il y ait un package MPLUS pour faire ce dont vous avez besoin. Il y a un article dans Psychometrika sur presque exactement ce sujet
springerlink.com/content/25r110007g417187
sauf que les données sont binaires et les trajectoires sont des trajectoires de probabilité. Les auteurs utilisent l'analyse de classe latente (mise en œuvre en utilisant un modèle de mélange fini pénalisé) pour regrouper les trajectoires. Je sais aussi que le premier auteur a écrit d'autres articles il y a environ 10 ans avec Bengt Muthen (créateur de MPLUS) sur l'analyse des classes latentes dans des contextes similaires (avec des trajectoires). Par exemple,
http://onlinelibrary.wiley.com/doi/10.1111/j.0006-341X.1999.00463.x/abstract
semble très similaire à ce dont vous parlez, sauf que le résultat est binaire. Le cas continu est beaucoup plus simple, donc je ferais une recherche documentaire à l'envers (c.-à-d. Regarde les articles auxquels ces articles font référence) pour trouver quelque chose qui correspond à ce que vous avez décrit plus précisément.
Pour en savoir plus, vous pouvez demander directement aux propriétaires de MPLUS quel package vous devez utiliser pour faire ce dont vous avez besoin. Ils sont généralement assez rapides pour répondre et sont très utiles:
http://www.statmodel.com/cgi-bin/discus/discus.cgi
la source