Je me demandais s'il y avait des techniques d'apprentissage automatique (non supervisées) pour modéliser des données longitudinales? J'ai toujours utilisé des modèles d'effets mixtes (principalement non linéaires) mais je me demandais s'il y avait d'autres façons de le faire (en utilisant l'apprentissage automatique).
Par apprentissage automatique, je veux dire forêt aléatoire, classification / clustering, arbres de décision et même apprentissage en profondeur, etc.
machine-learning
mixed-model
John_dydx
la source
la source
Réponses:
Dans le cas où il y a plusieurs observations d'un sujet (par exemple, plusieurs visites du même patient), l'ID du patient est une variable de «regroupement». Des précautions doivent être prises lors de l'évaluation du modèle afin que les visites du même patient n'apparaissent pas à la fois dans les données de formation et de test, car elles sont corrélées et conduiront à un gonflement de la précision du classificateur .
La documentation Sklearn de validation croisée contient des itérateurs de validation croisée pour les données groupées. Voir GroupKFold , LeaveOneGroupOut et LeavePGroupsOut .
Encore mieux, essayez les réseaux de neurones récurrents ou les modèles de Markov cachés .
la source
Vous pouvez modéliser votre longitudinal avec des méthodes d'apprentissage automatique standard en ajoutant simplement des fonctionnalités qui représentent la longitudinalité, par exemple en ajoutant une fonctionnalité qui représente le temps. Ou une fonctionnalité qui indique l'appartenance à un groupe, une personne, etc. (dans le cas des données du panneau).
Si vous êtes créatif avec la création / extraction de fonctionnalités, vous pouvez modéliser n'importe quoi avec des algorithmes ML.
la source