Pourquoi R trace-t-il des résidus standardisés contre des quantiles théoriques dans un tracé QQ?

9

Dans R, pourquoi les paramètres par défaut qqplot(linear model)utilisent-ils les résidus normalisés sur l'axe des y? Pourquoi R n'utilise-t-il pas les résidus "réguliers"?

MarkDollar
la source

Réponses:

13

Lorsque vous utilisez les résidus standardisés, la valeur attendue des résidus est nulle et la variance est (approximativement) un. Cela présente deux avantages:

  1. Si vous redimensionnez l'une de vos variables (par exemple, changez les kilomètres en milles), les tracés résiduels restent inchangés.
  2. Dans le qqplot, les résidus doivent se trouver sur la ligne y = x
  3. Vous vous attendez à ce que 95% de vos résidus se situent entre -1,96 et 1,96. Cela permet de repérer plus facilement les valeurs aberrantes.
csgillespie
la source
Pourriez-vous s'il vous plaît me donner une référence, que 95% devrait se situer entre -1,96; 1,96. En d'autres termes, pourquoi les résidus normalisés devraient-ils être ? jeN(0,1)
MarkDollar
@Mark: Il suffit de google "résidus résiduels standardisés" et regardez les premiers hits.
csgillespie
4

Les résidus théoriques dans un modèle linéaire sont indépendants de façon identique et normalement distribués. Cependant, les résidus observés ne sont pas indépendants et n'ont pas de variances égales. Ainsi, la standardisation des résidus se divise par l'écart-type estimé associé à ce résiduel, ce qui les rend plus égaux dans leurs variances (en utilisant les informations de la matrice de chapeau pour le calculer). C'est un résidu plus significatif à regarder dans le qqplot.

De plus, exécutez-vous vraiment qqplot sur le modèle adapté? ou est-ce le qqplot de la parcelle d'exécution sur le modèle?

Greg Snow
la source
1
Hey! Je parle du qqplot de l'exécution de plot (> lm <). Merci pour votre réponse. J'aimerais donner la note à cs, car sa réponse a été plus rapide. J'espère que cela vous
convient