Les techniques de régularisation peuvent-elles (devraient-elles?) Être utilisées dans un modèle à effets aléatoires?

11

Par techniques de régularisation, je fais référence au lasso, à la régression des crêtes, au filet élastique et similaires.

Envisager un modèle prédictif sur les données de soins de santé contenant des données démographiques et diagnostiques où la durée du séjour pour les séjours en milieu hospitalier est prévue. Pour certains individus, il existe plusieurs observations LOS (c.-à-d. Plus d'un épisode IP) au cours de la période de référence qui sont corrélées.

Est-il judicieux de construire, par exemple, un modèle prédictif net élastique qui contient un terme d'interception à effet aléatoire pour chaque individu?

RobertF
la source
Sous-titres pour votre première ligne: "Par des techniques d'effets aléatoires (c'est-à-dire des hypothèses sur la façon dont un paramètre est distribué de façon aléatoire), je me réfère aux prieurs de Laplace et aux prieurs normaux sur les paramètres de régression ... et autres" :-)
conjugateprior

Réponses:

7

Il y a quelques articles qui traitent de cette question. Je ne chercherais pas dans un ordre spécial:

  1. Pen.LME: Howard D Bondell, Arun Krishna et Sujit K Ghosh. Sélection de variable conjointe pour les effets fixes et aléatoires dans les modèles à effets mixtes linéaires Biometrics, 66 (4): 1069-1077, 2010.

  2. GLMMLASSO: Jurg Schelldorfer, Peter Buhlmann, Sara van de Geer. Estimation des modèles à effets mixtes linéaires de grande dimension utilisant la pénalisation L1. Scandinavian Journal of Statistics, 38 (2): 197-214, 2011.

qui peut être trouvé en ligne.

Il se trouve que je suis en train de terminer un article sur l'application d'une pénalité nette élastique au modèle mixte (LMMEN) et que je prévois de l'envoyer pour revue dans le mois à venir.

  1. LMMEN: Sidi, Ritov, Unger. Régularisation et classification des modèles mixtes linéaires via la pénalité nette élastique

Dans l'ensemble, si vous modélisez des données qui ne sont pas normales ou qui n'ont pas de lien d'identité, j'irais avec GLMMLASSO, (mais attention, il ne peut pas gérer beaucoup de RE). Sinon, Pen.LME est bon étant donné que vous ne disposez pas de données hautement corrélées, que ce soit dans les effets fixes ou aléatoires. Dans ce dernier cas, vous pouvez m'envoyer un mail et je serais heureux de vous envoyer du code / papier (je le mettrai sur cran dans un futur proche).

J'ai téléchargé sur CRAN aujourd'hui - lmmen . Il résout le problème du modèle linéaire mixte avec une pénalité de type filet élastique sur les effets fixes et aléatoires simultanément.

Il y a aussi dans le package des fonctions cv pour les packages lmmlasso et glmmLasso .

yonicd
la source
1
Yonicd, l'application du filet élastique aux modèles mixtes linéaires est exactement ce que je recherche. Je travaille avec des données génétiques qui sont corrélées, donc la sélection groupée d'un filet élastique serait très utile. J'ai essayé de vous contacter, mais je n'ai pas trouvé d'autre moyen que de poster cette réponse, car il semble impossible d'envoyer un message. Quoi qu'il en soit, j'ai hâte de lire votre article et j'essaierai votre code dès qu'il sera disponible.
5

J'ai toujours considéré la régression de crête comme de simples modèles empiriques à effets aléatoires non limités à une seule variable catégorielle (et sans matrices de corrélation fantaisistes). Vous pouvez presque toujours obtenir les mêmes prédictions en validant de manière croisée une pénalité de crête et en ajustant / estimant un simple effet aléatoire. Dans votre exemple, vous pourriez avoir de la fantaisie et avoir une pénalité de crête distincte sur les fonctionnalités de démonstration / diagnostic et une autre sur les indicateurs du patient (en utilisant quelque chose dans le facteur d'échelle de pénalité glmnet). Alternativement, vous pouvez inclure un effet aléatoire fantaisie qui a des effets temporels corrélés par personne. Aucune de ces possibilités n'est bonne ou mauvaise, elles sont juste utiles.

Parkes de karité
la source
2

Je pense actuellement à une question similaire. Je pense que dans l'application, vous pouvez le faire si cela fonctionne et vous pensez que cela est raisonnable. S'il s'agit d'un paramètre habituel d'effets aléatoires (cela signifie que vous avez des mesures répétées pour chaque groupe), il s'agit simplement d'une technique d'estimation, qui est moins controversée. Si vous n'avez pas beaucoup de mesures répétées pour la plupart des groupes, cela peut se situer à la limite du modèle à effets aléatoires habituel et vous voudrez peut-être soigneusement justifier sa validité (du point de vue de la méthodologie) si vous voulez le proposer comme un général méthode.

ltx5151
la source