Si vous vous souvenez, OLS minimise la somme des résidus carrés tandis que la régression médiane minimise la somme des résidus absolus . L'estimateur des écarts médians ou des écarts les moins absolus (DAL) est un cas particulier de régression quantile dans lequel vous avez . Dans la régression quantile, nous minimisons une somme d'erreurs absolues qui reçoivent des pondérations asymétriques pour la sur-prédiction et pour la sous-prédiction. Vous pouvez commencer à partir de la représentation CONT et l'étendre comme la somme de la fraction des données qui sont pondérées par et compte tenu de leur valeur de , et y travailler comme suit:∑iu2i∑i∣ui∣q=.5(1−q)qq(1−q)ui
ρq(u)=1(ui>0)q∣ui∣+1(ui≤0)(1−q)∣ui∣=1(yi−x′iβq>0)q∣yi−x′iβq∣+1(yi−x′iβq≤0)(1−q)∣yi−x′iβq∣
Ceci utilise simplement le fait que et ensuite vous pouvez réécrire la fonction d'indicateur en tant que sommes des observations qui satisfont les conditions des indicateurs . Cela donnera la première expression que vous avez notée pour l'estimateur de régression quantile.
ui=yi−x′iβq
=∑i:yi>x′iβqnq∣yi−x′iβq∣+∑i:yi≤x′iβqn(1−q)∣yi−x′iβq∣=q∑i:yi>x′iβqn∣yi−x′iβq∣+(1−q)∑i:yi≤x′iβqn∣yi−x′iβq∣=q∑i:yi>x′iβqn(yi−x′iβq)−(1−q)∑i:yi≤x′iβqn(yi−x′iβq)=q∑i:yi>x′iβqn(yi−x′iβq)−∑i:yi≤x′iβqn(yi−x′iβq)+q∑i:yi≤x′iβqn(yi−x′iβq)=q∑i=1n(yi−x′iβq)−∑i=1n1(yi−x′iβq≤0)(yi−x′iβq)=∑i=1n(q−1(ui≤0))ui
La deuxième ligne extrait les poids des sommations. La troisième ligne supprime les valeurs absolues et les remplace par les valeurs réelles. Par définition est négatif chaque fois que , d'où le changement de signe dans cette ligne. La quatrième ligne se multiplie . Vous réalisez alors que
et en remplaçant la sommation du moyen terme à la quatrième ligne par l'indicateur correspondant vous arrivez à la cinquième ligne. Factorisation puis remplacement deyi−x′iβqyi<x′iβq(1−q)
q∑i:yi>x′iβqn(yi−x′iβq)+q∑i:yi≤x′iβqn(yi−x′iβq)=∑i=1n(yi−x′iβq)
yi−x′iβqui
Cela montre comment les deux expressions sont équivalentes.