J'utilise la régression quantile pour trouver des prédicteurs du 90e centile de mes données. Je fais cela dans R en utilisant le quantreg
package. Comment puis-je déterminer pour la régression quantile qui indiquera le degré de variabilité expliqué par les variables prédictives?
Ce que je veux vraiment savoir: "Toute méthode que je peux utiliser pour trouver le degré de variabilité expliqué?". Les niveaux de signification par des valeurs P est disponible en sortie de la commande: summary(rq(formula,tau,data))
. Comment puis-je obtenir une bonne forme?
Réponses:
Koenker et Machado décrivent , une mesure locale de la qualité de l'ajustement au quantile particulier ( ).[1] R1 τ
SoitV(τ)=minb∑ρτ(yi−x′ib)
Soit et les estimations de coefficient pour le modèle complet et un modèle restreint, et soit et soit les termes correspondants .β^(τ) β~(τ) V^ V~ V
Ils définissent la qualité de l'ajustement critère .R1(τ)=1−V^V~
Koenker donne le code pour ici ,V
Donc, si nous calculons pour un modèle avec une interception uniquement ( - ou dans l'extrait de code ci-dessous), puis un modèle sans restriction ( ), nous pouvons calculer un qui est - au moins théoriquement - un peu comme le habituel .V V~ V^ R2
V0
R1 <- 1-Vhat/V0
Edit: Dans votre cas, bien sûr, le deuxième argument, qui serait mis à l'endroit où se
f$tau
trouve l'appel dans la deuxième ligne de code, sera la valeur quetau
vous avez utilisée. La valeur de la première ligne définit simplement la valeur par défaut.«Expliquer la variance de la moyenne» n'est vraiment pas ce que vous faites avec la régression quantile, donc vous ne devriez pas vous attendre à avoir une mesure vraiment équivalente.
Je ne pense pas que le concept de traduise bien en régression quantile. Vous pouvez définir différentes quantités plus ou moins analogues, comme ici, mais peu importe ce que vous choisissez, vous n'aurez pas la plupart des propriétés du vrai dans la régression OLS. Vous devez être clair sur les propriétés dont vous avez besoin et ce que vous n'avez pas - dans certains cas, il peut être possible d'avoir une mesure qui fait ce que vous voulez.R2 R2
-
Goodness of Fit and Related Inference Processes for Quantile Regression,
Journal of the American Statistical Association, 94 : 448, 1296-1310.
la source
tau
lorsque vous appelez la fonction. Je vais clarifier dans le post.La mesure pseudo- suggérée par Koenker et Machado (1999) dans JASA mesure la qualité de l'ajustement en comparant la somme des écarts pondérés pour le modèle d'intérêt avec la même somme d'un modèle dans lequel seule l'ordonnée à l'origine apparaît. Il est calculé commeR2
où est le ème quantile ajusté pour l'observation , et est la valeur ajustée de l'interception seule modèle.y^i=ατ+βτx τ i y¯=βτ
Voici un exemple dans R:
Cela pourrait probablement être accompli avec plus d'élégance.
la source
R_1(\tau) = 1 -
le dernier caractère est une sorte de gâchis. Pourriez-vous vérifier cela? Peut-être que vous avez collé un caractère non standard au lieu d'utiliser Tex.