On dit parfois que la régression quantile (QR) révèle des relations différentes entre les variables à différents quantiles de la distribution. Par exemple, Le Cook et al. «Penser au-delà de la moyenne: un guide pratique pour l'utilisation de méthodes de régression quantile pour la recherche sur les services de santé» implique que QR permet que les relations entre les résultats d'intérêt et les variables explicatives soient non constantes entre les différentes valeurs des variables.
Cependant, pour autant que je sache, dans un modèle de régression linéaire standard avec étant iid et indépendant de , l'estimateur QR pour la pente
Je suppose que la situation est différente lorsque certaines des hypothèses du modèle linéaire standard sont violées, par exemple sous certaines formes d'hétéroskédasticité conditionnelle. Alors peut-être que les estimateurs de pente QR convergent vers autre chose que la vraie pente du modèle linéaire et révèlent en quelque sorte des relations différentes à différents quantiles.
Qu'est-ce que je me trompe? Comment dois-je bien comprendre / interpréter l'affirmation selon laquelle la régression quantile révèle des relations différentes entre les variables à différents quantiles?
la source
Réponses:
La "pente réelle" dans un modèle linéaire normal vous indique à quel point la réponse moyenne change grâce à une augmentation d'un point de . En supposant une normalité et une variance égales, tous les quantiles de la distribution conditionnelle de la réponse évoluent en conséquence. Parfois, ces hypothèses sont très irréalistes: la variance ou l'asymétrie de la distribution conditionnelle dépendent de et donc, ses quantiles se déplacent à leur propre vitesse lors de l'augmentation dex x x . En QR, vous le verrez immédiatement à partir d'estimations de pente très différentes. Étant donné que l'OLS ne se soucie que de la moyenne (c'est-à-dire du quantile moyen), vous ne pouvez pas modéliser chaque quantile séparément. Là, vous vous fondez entièrement sur l'hypothèse d'une forme fixe de la distribution conditionnelle lorsque vous faites des déclarations sur ses quantiles.
MODIFIER: Intégrer un commentaire et illustrer
Si vous êtes prêt à faire ces hypothèses solides, il n'y a pas grand intérêt à exécuter QR car vous pouvez toujours calculer les quantiles conditionnels via la moyenne conditionnelle et la variance fixe. Les pentes «vraies» de tous les quantiles seront égales à la pente vraie de la moyenne. Dans un échantillon spécifique, il y aura bien sûr des variations aléatoires. Ou vous pourriez même détecter que vos hypothèses strictes étaient fausses ...
Permettez-moi d'illustrer par un exemple en R. Il montre la ligne des moindres carrés (noir) puis en rouge les quantiles modélisés à 20%, 50% et 80% de données simulées selon la relation linéaire suivante sorte que non seulement la moyenne conditionnelle de dépend de mais aussi de la variance.
Le code pour générer l'image:
la source