Bandes de confiance pour la ligne QQ

14

Cette question ne concerne pas spécifiquement R, mais j'ai choisi de l'utiliser Rpour l'illustrer.

Considérez le code pour produire des bandes de confiance autour d'une ligne qq (normale):

library(car)
library(MASS)
b0<-lm(deaths~.,data=road)
qqPlot(b0$resid,pch=16,line="robust")

Je cherche une explication (ou un lien alternatif vers un document papier / en ligne expliquant) comment ces bandes de confiance sont construites (j'ai vu une référence à Fox 2002 dans les fichiers d'aide de R mais malheureusement je ne l'ai pas livre à portée de main).

Ma question sera précisée avec un exemple. Voici comment Rcalcule ces CI particuliers (j'ai raccourci / simplifié le code utilisé dans car::qqPlot)

x<-b0$resid
good<-!is.na(x)
ord<-order(x[good])
ord.x<-x[good][ord]
n<-length(ord.x)
P<-ppoints(n)
z<-qnorm(P)
plot(z,ord.x,type="n")
coef<-coef(rlm(ord.x~z))
a<-coef[1]
b<-coef[2]
abline(a,b,col="red",lwd=2)
conf<-0.95
zz<-qnorm(1-(1-conf)/2)
SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)     #[WHY?]
fit.value<-a+b*z
upper<-fit.value+zz*SE
lower<-fit.value-zz*SE
lines(z,upper,lty=2,lwd=2,col="red")
lines(z,lower,lty=2,lwd=2,col="red")

La question est: quelle est la justification de la formule utilisée pour calculer ces SE (par exemple la ligne SE<-(b/dnorm(z))*sqrt(P*(1-P)/n)).

FWIW cette formule est très différente de la formule des bandes de confiance habituelles utilisées en régression linéaire

user603
la source
2
Je suppose que cela a à voir avec la distribution des statistiques de commande et plus particulièrementle résultat asymptotique:X(np)AN(F-1(p
fX(k)(x)=n!(k1)!(nk)![FX(x)]k1[1FX(x)]nkfX(x)
X(np)AN(F1(p),p(1p)n[f(F1(p))]2)
Glen_b -Reinstate Monica
4
@Glen_b a raison. John Fox écrit sur les pages 35-36: « L'erreur standard de la statistique de l' ordre est S E ( X ( i ) ) = σX(i)p(z)est la fonction de densité de probabilité correspondant au CDFP(z). Les valeurslongla ligne ajustée sont données parX(i)=μ+σzi. Une confiance95% environ "enveloppe" autourla ligne ajustée est,conséquent,X(i)±2×SE(X(i))« .
SE(X(i))=σ^p(zi)Pi(1Pi)n
p(z)P(z)X^(i)=μ^+σ^ziX^(i)±2×SE(X(i))
COOLSerdash
2
Je pense que la seule chose qui reste à voir est que est estimé par ( p ( z i ) / σ ) dans l'équation COOLSerdash donné. F(F-1(p))(p(zje)/σ^)
Glen_b -Reinstate Monica

Réponses:

6

FX(k)(X)=n!(k-1)!(n-k)![FX(X)]k-1[1-FX(X)]n-kFX(X)
X(np)UNEN(F-1(p),p(1-p)n[F(F-1(p))]2)

Comme COOLSerdash le mentionne dans les commentaires, John Fox [1] écrit aux pages 35-36:

X(je)

SE(X(i))=σ^p(zi)Pi(1Pi)n
p(z)P(z)X^(je)=μ^+σ^zjeX^(je)±2×SE(X(je)).

Ensuite, nous devons juste reconnaître que F(F-1(p)) est estimé par (p(zje)/σ^).

[1] Fox, J. (2008),
Analyse de régression appliquée et modèles linéaires généralisés, 2e éd. ,
Sage Publications, Inc

Glen_b -Reinstate Monica
la source