Cette question est inspirée de la longue discussion dans les commentaires ici: Comment la régression linéaire utilise-t-elle la distribution normale?
Dans le modèle de régression linéaire habituel, pour plus de simplicité, écrit ici avec un seul prédicteur: où les sont des constantes connues et sont des termes d'erreur indépendants de moyenne nulle. Si nous supposons en outre des distributions normales pour les erreurs, alors les estimateurs des moindres carrés habituels et les estimateurs du maximum de vraisemblance de sont identiques.x i ϵ i β 0 , β 1
Donc ma question facile: existe-t-il une autre distribution pour les termes d'erreur telle que les mle soient identiques à l'estimateur des moindres carrés ordinaires? La première implication est facile à montrer, l'autre pas.
la source
Réponses:
Dans l'estimation du maximum de vraisemblance, nous calculons
la dernière relation prenant en compte la structure de linéarité de l'équation de régression.
En comparaison, l'estimateur OLS satisfait
Afin d'obtenir des expressions algébriques identiques pour les coefficients de pente, nous devons avoir une densité pour le terme d'erreur telle que
Ce sont des équations différentielles de la forme qui ont des solutionsy′=±xy
Toute fonction qui possède ce noyau et s'intègre à l'unité sur un domaine approprié, rendra identiques le MLE et l'OLS pour les coefficients de pente. A savoir que nous recherchons
Y a-t-il un tel qui n'est pas la densité normale (ou la demi-normale ou la dérivée de la fonction d'erreur)?g
Certainement. Mais une autre chose à considérer est la suivante: si on utilise le signe plus dans l'exposant, et un support symétrique autour de zéro par exemple, on obtiendra une densité qui a un minimum unique au milieu, et deux maxima locaux à les limites du support.
la source
la source
Je ne savais pas à propos de cette question jusqu'à ce que @ Xi'an vient de mettre à jour avec une réponse. Il existe une solution plus générique. Les distributions de familles exponentielles avec certains paramètres fixaient les divergences de Bregman. Pour de telles distributions, la moyenne est le minimiseur. Le minimiseur OLS est également la moyenne. Par conséquent, pour toutes ces distributions, elles devraient coïncider lorsque la fonction linéaire est liée au paramètre moyen.
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.75.6958&rep=rep1&type=pdf
la source