Quelle est l'utilité de la ligne produite par qqline () dans R?

20

La qqnorm()fonction R produit un tracé QQ normal et qqline()ajoute une ligne qui passe par les premier et troisième quartiles. Quelle est l'origine de cette ligne? Est-il utile de vérifier la normalité? Ce n'est pas la ligne classique (la diagonale éventuellement après une mise à l'échelle linéaire).y=X

Voici un exemple. Je compare d'abord la fonction de distribution empirique avec la fonction de distribution théorique de : Maintenant, je trace le qq-plot avec la ligne ; ce graphique correspond grosso modo à une mise à l'échelle (non linéaire) du graphique précédent: Mais voici le qq-plot avec la R qqline: ce dernier graphique ne montre pas le départ comme dans le premier graphique.y = μN(μ^,σ^2)comparaison des fonctions de distribution cumulativey=μ^+σ^Xqqnorm avec la "bonne" ligneqqnorm et qqline

Stéphane Laurent
la source

Réponses:

9

Comme vous pouvez le voir sur la photo,entrez la description de l'image ici

obtenu par

> y <- rnorm(2000)*4-4
> qqnorm(y); qqline(y, col = 2,lwd=2,lty=2)

la diagonale n'aurait pas de sens car le premier axe est mis à l'échelle en termes de quantiles théoriques d'une distribution . Je pense que l'utilisation des premier et troisième quartiles pour définir la ligne donne une approche robuste pour estimer les paramètres de la distribution normale, par rapport à l'utilisation de la moyenne et de la variance empiriques, par exemple. Les départs de la ligne (sauf dans les queues) indiquent un manque de normalité.N(0,1)

Xi'an
la source
La diagonale "après mise à l'échelle linéaire" est ici obtenue par abline (moyenne (y), sd (y)). Ici, vous simulez des données normales, donc ces deux lignes sont proches. Mais parfois, les données ne sont pas proches d'une distribution normale mais le qqplot est proche de la qqline, mais pas de la diagonale "après mise à l'échelle".
Stéphane Laurent
... je vais ajouter un exemple à ma question
Stéphane Laurent
4
Je pense que c'était mon point en déclarant que l'utilisation des quartiles est plus robuste que l'utilisation de la moyenne et de la variance empiriques.
Xi'an
1
D'accord, merci beaucoup. Maintenant, cela semble évident. La qqline pourrait être préférable car parfois en pratique la non-normalité dans les queues est acceptable. Mais il n'y a pas vraiment besoin de tracer la qqline: un contrôle visuel suffit - la seule chose dont nous avons besoin est de comprendre le QQ-plot :)
Stéphane Laurent
1
Ok - je tag, mais la réponse elle-même n'était pas satisfaisante: la réponse avec notre discussion est; mais c'est ma faute: ma question n'était pas claire avant d'ajouter l'exemple. Soit dit en passant, ma question est quelque peu liée au test KS: qu'en est-il du choix des estimations et lorsque nous tapons ks.test (x, "pnorm", mu.hat, sigma.hat )? σμ^σ^
Stéphane Laurent