Quelles parcelles diagnostiques existent pour la régression quantile?

25

Suite à ma question pour l'OLS , je me demande: quels graphiques de diagnostic existent pour la régression quantile? (et y en a-t-il une mise en œuvre?)

Une recherche rapide sur Google a déjà abouti à l' intrigue du ver (dont je n'ai jamais entendu parler auparavant), et je serais heureux de connaître d'autres méthodes que vous pourriez connaître. (y en a-t-il un d'OLS porté pour la régression quantile?)

Tal Galili
la source
Je suppose que vous avez trouvé que la bibliothèque gamlss a une implémentation du tracé de ver.
Peter Ellis

Réponses:

16

La régression quantile ne fait pas d'hypothèses de distribution, c'est-à-dire des hypothèses sur les résidus, sauf en supposant que la variable de réponse est presque continue. Si vous abordez le problème de l'estimation d'un seul quantile en tant que fonction prédicteurs X, de loin et de loin les principales choses qui peuvent mal tourner sont les erreurs de spécification du prédicteur linéaireXβen sous-ajustant, c'est-à-dire en omettant d'inclure des effets non linéaires (un problème commun) ou des effets d'interaction. Il existe au moins deux approches recommandées. Premièrement, si la taille de votre échantillon est grande, adaptez-vous simplement à un modèle plus flexible. Un bon compromis est de permettre à tous les effets principaux d'être non linéaires en utilisant des splines de régression telles que des splines cubiques restreintes (splines naturelles). Ensuite, il n'y a rien à vérifier, sauf pour les interactions. La deuxième approche consiste à espérer que le modèle est simple (pourquoi?) Mais à permettre qu'il soit complexe, puis à évaluer l'impact des ajouts complexes au modèle simple. Par exemple, nous pouvons évaluer les contributions combinées de termes non linéaires ou d'interaction ou des deux. Un exemple suit, en utilisant le R rmsetquantregpaquets. Un formulaire d'interaction de compromis est utilisé pour limiter le nombre de paramètres. Les interactions sont limitées pour ne pas être doublement non linéaires.

require(rms)
# Estimate 25th percentile of y as a function of x1 and x2
f <- Rq(y ~ rcs(x1, 4) + rcs(x2, 4) + rcs(x1, 4) %ia% rcs(x2, 4), tau=.25)
# rcs = restricted cubic spline, here with 4 default knots
# %ia% = restricted interaction
# To use general interactions (all cross product terms), use:
# f <- Rq(y ~ rcs(x1, 4)*rcs(x2, 4), tau=.25)
anova(f)   # get automatic combined 'chunk' tests: nonlinearity, interaction
# anova also provides the combined test of complexity (nonlin. + interact.)
Frank Harrell
la source