Comparaison des résidus entre régressions OLS et non OLS

9

Supposons que vous vouliez estimer un modèle linéaire: ( observations de la réponse et prédicteurs) np+1

E(yi)=β0+j=1pβjxij

Pour ce faire, vous pouvez utiliser la solution OLS, c'est-à-dire choisir les coefficients de sorte que la somme des erreurs carrées soit minimale:

(β0,β1,,βp)T=argminβ0,β1,,βpi=1n(yiβ0j=1pβjxij)2

Alternativement, vous pouvez utiliser une autre fonction de perte, comme la somme des écarts absolus, de sorte que:

(β0,β1,,βp)T=argminβ0,β1,,βpi=1n|yiβ0j=1pβjxij|

Supposons que vous ayez trouvé les paramètres des deux modèles et que vous souhaitiez choisir le modèle avec la plus petite valeur de la fonction de perte. Comment comparer les valeurs minimales atteintes par les fonctions de perte en général? (c'est-à-dire pas seulement ce cas spécifique - nous pourrions également essayer d'autres fonctions de perte basées sur Lp ) Il semble y avoir une différence dans l'échelle des fonctions - l'une traite des carrés tandis que l'autre ne le fait pas.

Comp_Warrior
la source
1
Eh bien, les hypothèses de Markov montrent que la première équation est BLEUE, ou le meilleur estimateur linéaire sans biais. Dans ce cas, "Best" est déterminé en ayant les plus petites erreurs standard de tous les estimateurs possibles. N'est-ce pas une statistique adéquate?
gregmacfarlane
2
notez que et ainsix2x1nx2
argminβ0,β1,,βpi=1n(yiβ0j=1pβjxij)2argminβ0,β1,,βpi=1n|yiβ0j=1pβjxij|(n)argminβ0,β1,,βpi=1n(yiβ0j=1pβjxij)2
Manuel
1
@gmacfarlane Je veux définir ici le "meilleur" en termes de valeur minimale de la fonction de perte, au lieu de l'erreur standard sur les estimations des paramètres. (juste par curiosité)
Comp_Warrior
2
Je pense que vous ne pouvez pas comparer les ajustements qui proviennent de 2 fonctions de perte différentes, car ce sont des réponses à des questions différentes. Une fois que vous décidez qu'une fonction de perte donnée est appropriée à votre situation, l'ajustement découle de cette décision. Vous ne pouvez pas le replier pour valider le choix de la fonction de perte sans que cela devienne circulaire. Si vous avez un autre critère qui peut être compris comme englobant les deux fonctions de perte, vous pouvez l'utiliser, mais vous devez l'avoir défini à l'avance.
gung - Rétablir Monica
1
Notez que si le modèle de l'attente était correct et que la taille des échantillons était suffisamment grande pour que les deux estimations soient effectivement à la valeur de la population, la question se convertirait alors effectivement en "Comment comparer un écart moyen avec un écart-type"? Sous n'importe quelle hypothèse de distribution donnée, vous pouvez alors comparer leur taille attendue, mais bien sûr, dans de petits échantillons, les estimations elles-mêmes diffèrent.
Glen_b -Reinstate Monica

Réponses:

4

(Conversion de mon commentaire en réponse.)

Je pense que vous ne pouvez pas comparer les ajustements qui proviennent de différentes fonctions de perte, car ils sont des réponses à différentes questions. Une fois que vous décidez qu'une fonction de perte donnée est appropriée à votre situation, l'ajustement découle de cette décision. Vous ne pouvez pas le replier pour valider le choix de la fonction de perte sans que cela devienne circulaire. Si vous avez un autre critère qui peut être compris comme englobant les deux fonctions de perte, vous pouvez l'utiliser, mais vous devez l'avoir défini à l'avance.

gung - Réintégrer Monica
la source