Modèles mixtes linéaires généralisés: diagnostics

11

J'ai une régression logistique d'interception aléatoire (due à des mesures répétées) et je voudrais faire quelques diagnostics, en particulier concernant les valeurs aberrantes et les observations influentes.

J'ai regardé les résidus pour voir s'il y a des observations qui ressortent. Mais je voudrais aussi regarder quelque chose comme la distance de Cook ou DFFITS. Hosmer et Lemeshow (2000) disent qu'en raison du manque d'outils de diagnostic de modèle pour les données corrélées, il faut simplement adapter un modèle de régression logistique régulier en ignorant la corrélation et utiliser les outils de diagnostic disponibles pour la régression logistique régulière. Ils soutiennent que ce serait mieux que de ne faire aucun diagnostic.

Le livre date de 2000 et je me demande s'il existe actuellement des méthodes de diagnostic des modèles avec régression logistique à effets mixtes? Quelle serait une bonne approche pour vérifier les valeurs aberrantes?

Edit (5 novembre 2013):

En raison du manque de réponses, je me demande si faire des diagnostics avec des modèles mixtes n'est pas fait en général ou plutôt pas une étape importante lors de la modélisation des données. Permettez-moi donc de reformuler ma question: que faites-vous une fois que vous avez trouvé un «bon» modèle de régression?

Emilia
la source
Duplication possible d'une question récente similaire qui n'a pas non plus reçu beaucoup d'attention: stats.stackexchange.com/q/70783/442
Henrik
Vous pouvez trouver ma réponse à une question similaire utile.
Randel

Réponses:

2

Les méthodes de diagnostic sont en effet différentes pour les modèles mixtes linéaires généralisés. Un raisonnable que j'ai vu qui est basé sur les résidus d'un GLMM est dû à Pan et Lin (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x). Ils ont utilisé des sommes cumulées de résidus où l'ordre est imposé soit par les variables explicatives, soit par le prédicteur linéaire, testant ainsi soit la spécification de la forme fonctionnelle d'un prédicteur donné, soit la fonction de liaison dans son ensemble. Les distributions nulles sont basées sur des simulations de l'espace de conception à partir de la distribution nulle des spécifications correctes, et elles ont démontré des propriétés de taille et de puissance décentes de ce test. Ils n'ont pas discuté spécifiquement des valeurs aberrantes, mais je peux imaginer que les valeurs aberrantes devraient probablement annuler au moins la fonction de lien en la recourbant trop vers l'observation influente.

StasK
la source
0

Il existe de nombreuses opinions différentes sur la meilleure façon d'examiner les diagnostics pour les modèles mixtes. En règle générale, vous souhaiterez examiner à la fois les résidus et les aspects standard qui seraient examinés pour un modèle à mesures non répétées.

En plus de ceux-ci, généralement, vous voudrez également regarder les effets aléatoires eux-mêmes. Les méthodes impliquent souvent de tracer les effets aléatoires par diverses covariables et de rechercher la non-normalité dans la distribution des effets aléatoires. Il existe de nombreuses autres méthodes (certaines mentionnées dans les commentaires précédents), mais c'est généralement un bon début.

Bill Denney
la source