Régression quantile: fonction de perte

24

J'essaie de comprendre la régression quantile, mais une chose qui me fait souffrir est le choix de la fonction de perte.

ρτ(u)=u(τ-1{u<0})

Je sais que le minimum de l'attente de est égal au -quantile, mais quelle est la raison intuitive de commencer avec cette fonction? Je ne vois pas la relation entre la minimisation de cette fonction et le quantile. Quelqu'un peut-il me l'expliquer?τ %ρτ(y-u)τ%

CDO
la source

Réponses:

28

Je comprends cette question comme demandant un aperçu de la façon dont on pourrait trouver une fonction de perte qui produit un quantile donné comme minimiseur de perte, quelle que soit la distribution sous-jacente. Il ne serait donc pas satisfaisant de répéter l'analyse sur Wikipedia ou ailleurs qui montre que cette fonction de perte particulière fonctionne.

Commençons par quelque chose de familier et de simple.

Qu'est - ce que vous parlez est de trouver un « emplacement » par rapport à une distribution ou un ensemble de données . Il est bien connu, par exemple, que la moyenne ˉ x minimise le carré résiduel attendu; c'est-à-dire que c'est une valeur pour laquelle FXFX¯

LF(X¯)=R(X-X¯)2F(X)

est aussi petit que possible. J'ai utilisé cette notation pour nous rappeler que est dérivé d'une perte , qu'il est déterminé par F , mais plus important encore, cela dépend du nombre ˉ x .LFX¯

La façon standard de montrer que minimise toute fonction commence par démontrer que la valeur de la fonction ne diminue pas lorsque x est légèrement modifié. Une telle valeur est appelée un point critique de la fonction.XX

Quel type de fonction de perte ferait d'un centile F - 1 ( α ) un point critique? La perte pour cette valeur seraitΛF-1(α)

LF(F-1(α))=RΛ(X-F-1(α))F(X)=01Λ(F-1(u)-F-1(α))u.

Pour que ce soit un point critique, sa dérivée doit être nulle. Puisque nous essayons juste de trouver une solution, nous ne nous arrêterons pas pour voir si les manipulations sont légitimes: nous prévoyons de vérifier les détails techniques (comme si nous pouvons vraiment différencier , etc. ) à la fin. AinsiΛ

(1)0=LF(x)=LF(F1(α))=01Λ(F1(u)F1(α))du=0αΛ(F1(u)F1(α))duα1Λ(F1(u)F1(α))du.

Sur le côté gauche, l'argument de est négatif, tandis que sur le côté droit il est positif. En dehors de cela, nous avons peu de contrôle sur les valeurs de ces intégrales car F pourrait être n'importe quelle fonction de distribution. Par conséquent, notre seul espoir est de faire dépendre Λ uniquement du signe de son argument, et sinon il doit être constant.ΛFΛ

Cela implique que sera linéaire par morceaux, potentiellement avec des pentes différentes à gauche et à droite de zéro. De toute évidence, il devrait diminuer à l'approche de zéro - c'est, après tout, une perte et non un gain . De plus, le redimensionnement de Λ par une constante ne changera pas ses propriétés, nous pouvons donc nous sentir libres de régler la pente de gauche sur - 1 . Soit τ > 0 la pente de droite. Alors ( 1 ) se simplifie pourΛΛ1τ>0(1)

0=ατ(1α),

d'où la solution unique est, jusqu'à un multiple positif,

Λ(x)={x, x0α1αx, x0.

La multiplication de cette solution (naturelle) par , pour effacer le dénominateur, produit la fonction de perte présentée dans la question.1α

Clairement, toutes nos manipulations sont mathématiquement légitimes lorsque a cette forme. Λ

whuber
la source
19

ρτ(X-m)=(X-m)(τ-1(X-m<0))={τ|X-m|jeFX-m0(1-τ)|X-m|jeFX-m<0)

τXτ0,25

m=0,25mτ

jjet
la source
1
Cela ne devrait-il pas être l'inverse? Une sous-estimation coûtera trois fois plus cher?
Edi Bice
Merci d'avoir attrapé ça. La formule est correcte, mais je l'ai initialement formulée incorrectement dans mon explication.
jjet