Prédiction de régression quantile

13

Je suis intéressé à utiliser la régression quantile pour certains de mes modèles, mais j'aimerais avoir des clarifications sur ce que je peux réaliser en utilisant cette méthodologie. Je comprends que je peux obtenir une analyse plus robuste de la relation IV / DV , en particulier face aux valeurs aberrantes et à l'hétéroscédasticité, mais dans mon cas, l'accent est mis sur la prédiction.

En particulier, je souhaite améliorer l'ajustement de mes modèles, sans recourir à des modèles non linéaires plus complexes, ni même à une régression linéaire par morceaux. Lors de la prédiction, est-il possible de sélectionner le quantile de résultat de probabilité le plus élevé en fonction de la valeur des prédicteurs? En d'autres termes, est-il possible de déterminer chaque probabilité quantile de résultat prédite, sur la base de la valeur des prédicteurs?

Robert Kubrick
la source

Réponses:

8

YXx¯±1.96sY

Frank Harrell
la source
1
Je pense que je comprends comment fonctionne le processus d'ajustement. Ce que je ne comprends pas, c'est s'il existe un moyen d'améliorer la prédiction (sélection des paramètres quantiles) sans savoir dans quel quantile l'observation sera. Pouvons-nous en quelque sorte déduire cela des valeurs des prédicteurs? Il y a peut-être quelque chose qui peut être utilisé en fonction de la distribution de probabilité des prédicteurs par rapport aux observations.
Robert Kubrick
2
Y|X=xYX=x
2
Frank, je suis sûr que je dois en savoir plus sur la régression quantile. Avant de plonger, j'aimerais comprendre si cette méthodologie peut offrir une composante probabiliste pour le choix du quantile, sur la base des prédicteurs et du modèle ajusté. Pour chaque ensemble / plage de valeurs prédictives donné, il doit y avoir une probabilité que le résultat réel tombe dans une certaine région de quantile.
Robert Kubrick
4

La régression quantile consiste à prédire les quantiles de la variable dépendante. En régression "régulière", nous prédisons la moyenne de la DV. Mais l'intérêt pourrait être dans d'autres parties du DV. Par exemple, vous pourriez être intéressé à prédire quels nouveau-nés seront très légers, quelles chansons seront exceptionnellement populaires ou quels clients achèteront une tonne de choses.

J'ai écrit un article à ce sujet pour NESUG l'année dernière.

Peter Flom - Réintégrer Monica
la source
2
Vous choisissez le quantile à prédire en fonction de ce que vous voulez savoir. Aucun programme ne peut vous dire quelle question poser!
Peter Flom - Réintègre Monica
1
Étant donné le modèle ajusté, ne pouvez-vous pas calculer la probabilité qu'une valeur prédite tombe dans le quantile 0,6, sur la base des valeurs du prédicteur?
Robert Kubrick
2
Pas "dans le quantile .6" mais au niveau ou au-dessus du quantile 0.6, mais oui. Mais vous devez décider quel quantile vous souhaitez prédire. Dans la régression OLS, vous prédisez la moyenne conditionnelle; dans la régression quantile vous prédisez les quantiles conditionnels
Peter Flom - Réinstallez Monica
5
Comme Peter l'a indiqué, vous ne comprenez toujours pas les commentaires antérieurs. La régression quantile n'a rien à voir avec le calcul des probabilités de tomber au-dessus ou en dessous d'un certain quantile (notez que la probabilité de tomber "dans" le quantile 0.6 est nulle par définition). Si vous souhaitez prédire la médiane ou d'autres quantiles, faites-le. Un quantile conditionnel est un nombre unique et non une plage.
Frank Harrell
1
Si je comprends bien, vous choisissez le quantile à utiliser pour les prédictions ur, mais n'y a-t-il pas un moyen de choisir le quantile qui est le mieux pour la prédiction e