Des exemples de cette page montrent que la régression simple est nettement affectée par les valeurs aberrantes et cela peut être surmonté par des techniques de régression robuste: http://www.alastairsanderson.com/R/tutorials/robust-regression-in-R/ . Je pense que lmrob et ltsReg sont d'autres techniques de régression robustes.
Pourquoi ne devrait-on pas effectuer une régression robuste (comme rlm ou rq) à chaque fois plutôt que d'effectuer une régression simple (lm)? Y a-t-il des inconvénients à ces techniques de régression robustes? Merci pour votre perspicacité.
Réponses:
Le théorème de Gauss-Markov :
Dans un modèle linéaire avec des erreurs sphériques (qui inclut en cours de route une hypothèse d'absence de valeurs aberrantes, via une variance d'erreur finie), l'OLS est efficace dans une classe d'estimateurs linéaires sans biais - il existe des conditions (restrictives, bien sûr) dans lesquelles " vous ne pouvez pas faire mieux que OLS ".
la source