Cet article utilise des modèles linéaires généralisés (distributions d'erreur binomiale et binomiale négative) pour analyser les données. Mais ensuite, dans la section analyse statistique des méthodes, il y a cette déclaration:
... et deuxièmement en modélisant les données de présence à l'aide de modèles de régression logistique et les données de temps de recherche de nourriture à l'aide d'un modèle linéaire généralisé (GLM). Une distribution binomiale négative avec une fonction de liaison logarithmique a été utilisée pour modéliser les données de temps de recherche de nourriture (Welsh et al. 1996) et l'adéquation du modèle a été vérifiée en examinant les résidus (McCullagh et Nelder 1989). Des tests de Shapiro – Wilk ou de Kolmogorov – Smirnov ont été utilisés pour tester la normalité en fonction de la taille de l'échantillon; les données ont été transformées en logarithme avant les analyses pour respecter la normalité.
S'ils supposent des distributions d'erreur binomiale et binomiale négative, alors ils ne devraient certainement pas vérifier la normalité des résidus?
Réponses:
NB: les résidus de déviance (ou Pearson) ne devraient pas avoir une distribution normale, sauf pour un modèle gaussien. Pour le cas de régression logistique, comme le dit @Stat, les résidus de déviance pour la ème observation y i sont donnés parje yje
Les choses sont similaires pour les GLM binomiaux de Poisson ou négatifs: pour les comptages prédits faibles, la distribution des résidus est discrète et asymétrique, mais tend à la normalité pour les comptages plus importants sous un modèle correctement spécifié.
Il n'est pas habituel, du moins pas dans mon coin de bois, d'effectuer un test formel de normalité résiduelle; si le test de normalité est essentiellement inutile lorsque votre modèle suppose une normalité exacte, alors a fortiori il est inutile quand il ne le fait pas. Néanmoins, pour les modèles non saturés, les diagnostics graphiques résiduels sont utiles pour évaluer la présence et la nature du manque d'ajustement, en prenant la normalité avec une pincée ou une poignée de sel en fonction du nombre de répétitions par modèle de prédicteur.
la source
Ce qu'ils ont fait est correct! Je vais vous donner une référence à la double vérification. Voir la section 13.4.4 dans Introduction à l'analyse de régression linéaire, 5e éditionpar Douglas C. Montgomery, Elizabeth A. Peck, G. Geoffrey Vining. En particulier, regardez les exemples à la page 460, où ils s'adaptent à une glm binomiale et revérifiez l'hypothèse de normalité des «résidus de déviance». Comme mentionné à la page 458, cela est dû au fait que «les résidus de déviance se comportent un peu comme les résidus ordinaires dans un modèle de régression linéaire standard de théorie normale». Il est donc logique de les tracer sur une échelle de tracé de probabilité normale ainsi que sur des valeurs ajustées. Voir à nouveau la page 456 de la référence ci-dessus. Dans les exemples qu'ils ont fournis aux pages 460 et 461, non seulement pour le cas binomial, mais aussi pour le glm de Poisson et le Gamma avec (lien = log), ils ont vérifié la normalité des résidus de déviance.
Pour le cas binomial, le résiduel de déviance est défini comme:
Vérifiez ici également le cas de Poisson.
la source