Quand quelqu'un dit que la déviance résiduelle / df devrait ~ 1 pour un modèle de Poisson, quelle est approximative approximative?

16

J'ai souvent vu les conseils pour vérifier si un ajustement du modèle de Poisson est trop dispersé, ce qui implique de diviser la déviance résiduelle par les degrés de liberté. Le rapport résultant doit être "environ 1".

La question est de savoir de quelle plage parlons-nous pour "approximative" - ​​quel est le ratio qui devrait déclencher des alarmes pour envisager d'autres formes de modèle?

Fomite
la source
2
Pas une réponse à cette question intéressante, mais ce que je vais souvent faire, c'est exécuter plusieurs modèles (par exemple Poissson, NB, peut-être des versions gonflées à zéro) et les comparer - à la fois sur des mesures de type AIC et sur des valeurs prédites.
Peter Flom - Réintègre Monica
Ce lien pourrait être intéressant. Surtout la section "Critères d'évaluation de la qualité de l'ajustement".
@Procrastinator Le lien est un exemple parfait de ce dont je parle: "Ensuite, si notre modèle correspond bien aux données, le rapport de la déviance à DF, Value / DF, devrait être d'environ un. Les valeurs de ratio élevées peuvent indiquer le modèle erreur de spécification ou variable de réponse sur-dispersée; des ratios inférieurs à un peuvent également indiquer une erreur de spécification du modèle ou une variable de réponse sous-dispersée. " Quelle est la gamme de "environ 1"? 0,99 à 1,01? 0,75 à 2?
Fomite
r-bloggers.com/… a également quelques informations sur la façon de répondre à cette question, bien que la réponse de @ StasK la couvre suffisamment bien.
vole

Réponses:

14

10 est grand ... 1,01 ne l'est pas. Puisque la variance de a χk2 est de 2k (voir Wikipedia ), l'écart-type de a χk2 est 2k , et celle deχk2/kest2/k . C'est votre bâton de mesure: pourχ1002 , 1,01 est pas grande, mais 2 est grande (7 sds loin). Pourχ10,0002 , 1.01 est OK, mais 1.1 n'est pas (7 sds loin).

StasK
la source
1
"donc a un écart type de χk2/k "pouvez-vous me diriger vers un endroit qui le démontre s'il vous plaît?2/k
baxx
amazon.com/… . Désolé d'être un connard, mais c'est une distribution de référence dans l'inférence statistique; si vous ne le comprenez pas, vous ne devriez pas travailler avec des modèles linéaires généralisés tels que Poisson.
StasK
2
Pour référence future, vous pouvez, au lieu du préfixe / des excuses sur le fait d'être un connard, indiquer simplement les informations et une référence. Cela vous éviterait probablement de taper et vous ferait apparaître moins un connard, ce qui pourrait être une expérience nouvelle.
baxx
Voir edit et la référence wikipedia. J'ai proposé quelques centaines de réponses en quelques années, donc j'avoue qu'il est un peu difficile pour moi d'avoir une expérience vraiment nouvelle.
StasK
7

Asymptotiquement, la déviance doit être distribuée en chi carré avec une moyenne égale aux degrés de liberté. Donc, divisez-le par ses degrés de liberté et vous devriez obtenir environ 1 si les données ne sont pas trop dispersées. Pour obtenir un test approprié, il suffit de rechercher la déviance dans les tableaux de chi carré - mais notez (a) que la distribution du chi carré est une approximation & (b) qu'une valeur élevée peut indiquer d'autres types de manque d'ajustement (c'est peut-être pourquoi «environ 1» est considéré comme suffisant pour les travaux du gouvernement).

Scortchi - Réintégrer Monica
la source