Ligne de référence du tracé QQ non à 45 °

10

Je traçais des données de retour (standardisées) avec qqplot()dans MATLAB contre les quantiles théoriques d'une distribution normale. Cependant, la ligne du QQ-Plot n'a pas un angle de 45 ° mais est légèrement tournée.

Peut-être que je comprends mal le concept d'un tracé QQ, mais n'est-il pas censé être exactement une ligne à 45 °?

J'ai mis l'intrigue pour illustrer le problème.

QQ Diagramme des données de retour normalisées

mscnvrsy
la source
Les données de retour normalisées sont bien connues pour être non normales, alors pourquoi se situeraient-elles sur une ligne de 45 degrés? Les retours sont plus lourds que la normale et c'est ce que vos données montrent également.
Glen_b -Reinstate Monica
Je suis conscient de la non-normalité et du fait que les points ne doivent pas reposer sur la ligne elle-même. Je me demandais plutôt pourquoi la ligne n'est pas à 45 °.
mscnvrsy
Oh désolé, ce n'était pas clair. J'ai posté une réponse.
Glen_b -Reinstate Monica

Réponses:

18

Doit-il s'agir d'une ligne à 45 degrés? Ça dépend!

Un tracé QQ est la courbe paramétrique définie par:

x=F1(p)y=G1(p)

pour . Où et sont des fonctions CDF inverses.p[0,1]F1G1

Si alors et ce serait sur une ligne de 45 degrés.F=Gx(p)=y(p)

Un autre cas ...

  • Soit le CDF inverse normal standard.Φ1(p)
  • SoitF1(p)=Φ1(p)
  • SoitG1(p)=σΦ1(p)+μ

C'est-à-dire que est le CDF inverse pour une variable aléatoire normalement distribuée avec la moyenne et l'écart-type tandis que est le CDF inverse pour une variable normale standard (c'est-à-dire la moyenne 0, l'écart-type 1). Ensuite, nous voyons:GμσF

y(p)=σΦ1(p)+μ=σx(p)+μ

Autrement dit, l'intrigue est une ligney=σx+μ

Que se passe-t-il dans votre cas?

De la documentation Matlab pourqqplot

Sur la parcelle se superpose une ligne joignant les premier et troisième quartiles de chaque distribution (il s'agit d'un ajustement linéaire robuste des statistiques d'ordre des deux échantillons). Cette ligne est extrapolée aux extrémités de l'échantillon pour aider à évaluer la linéarité des données.

Donc, même si vous standardisez vos données, les tracés de la ligne rouge MATLAB ne seraient pas une ligne à 45 degrés si les 1er et 3e quartiles ne correspondaient pas à la distribution normale.

Matthew Gunn
la source
Je vous remercie! Je pensais que la ligne rouge est construite de manière à ce que vous puissiez voir les écarts par rapport aux quantiles normaux standard? Lorsque j'utilise des données standardisées, la ligne doit alors être y = x, n'est-ce pas?
mscnvrsy
@mscnvrsy La ligne rouge je pense que dans MATLAB est construite pour montrer ce que cela devrait être si vos données suivaient la distribution normale.
Matthew Gunn
Existe-t-il un moyen d'obtenir une ligne à 45 ° comme ligne de référence? Je pensais que cela pourrait être réalisé en normalisant.
mscnvrsy
@mscnvrsy hmmm .... Je ne sais plus d'où vient la ligne rouge de MATLAB dans le QQPlot: P Donne-moi une seconde ... Je vérifie le code source ...
Matthew Gunn
Pour moi, cela ressemble plus à un ajustement OLS. Mais malheureusement, on ne peut pas définir de paramètres pertinents dans le qqplot().
mscnvrsy
2

La façon dont la ligne est déterminée varie d'un package à l'autre, mais une façon courante consiste à joindre le point de quartile inférieur au point de quartile supérieur .(x,y)=(0.6745,Q1)(0.6745,Q3)

En regardant l'aide de Matlab pour qqplot, c'est en fait ce que dit Matlab.

La distribution de l'échantillon est à pic et à queue lourde d'une manière qui rapproche ses quartiles qu'ils ne le sont pour une normale avec le même écart-type, ce qui rend la pente plus proche de 0,7 que de 1.

Glen_b -Reinstate Monica
la source