Mon collègue et moi ajustons une gamme de modèles d'effets mixtes linéaires et non linéaires dans R. On nous demande d'effectuer une validation croisée sur les modèles ajustés afin que l'on puisse vérifier que les effets observés sont relativement généralisables. C'est normalement une tâche triviale, mais dans notre cas, nous devons diviser l'ensemble des données en une partie de formation et une partie de test (à des fins de CV) qui ne partagent aucun niveau commun. Par exemple,
Les données d'entraînement peuvent être basées sur les groupes 1, 2, 3, 4; Le modèle ajusté est ensuite validé de façon croisée sur le groupe 5.
Cela crée donc un problème car les effets aléatoires basés sur les groupes estimés sur les données d'entraînement ne s'appliquent pas aux données de test. Ainsi, nous ne pouvons pas CV le modèle.
Existe-t-il une solution relativement simple à cela? Ou quelqu'un a-t-il déjà écrit un paquet pour résoudre ce problème? Tout indice est le bienvenu!
Merci!
la source
Réponses:
Fang (2011) a démontré une équivalence asymptotique entre l'AIC appliqué aux modèles mixtes et la validation croisée avec omission d'un groupe. Peut-être que cela satisferait votre évaluateur, vous permettant de calculer simplement AIC comme une approximation plus facile à calculer de ce qu'il a demandé?
la source
Colby et Bair (2013) ont développé une approche de validation croisée qui peut être appliquée aux modèles à effets mixtes non linéaires. Vous pouvez visiter ce lien pour en savoir plus.
la source