http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/
Si vous regardez en haut de cet article, l'auteur mentionne que la norme L2 a une solution unique et que la norme L1 a peut-être de nombreuses solutions. Je comprends cela en termes de régularisation, mais pas en termes d'utilisation de la norme L1 ou de la norme L2 dans la fonction de perte.
Si vous regardez les graphiques des fonctions de scalaire x (x ^ 2 et | x |), vous pouvez facilement voir que les deux ont une solution unique.
regression
lasso
regularization
user3180
la source
la source
Réponses:
Considérons un problème unidimensionnel pour une exposition la plus simple possible. (Les cas de dimension supérieure ont des propriétés similaires.)
Étant donné que (en dehors de certaines circonstances spécifiques), vous n'avez généralement aucune garantie d'une telle absence d'observations hautement influentes, je ne dirais pas que la régression L1 est robuste.
Code R pour le tracé:
la source
plot
. Je suis épaté.Minimiser la perte L2 correspond au calcul de la moyenne arithmétique, qui est sans ambiguïté, tandis que minimiser la perte L1 correspond au calcul de la médiane, qui est ambigu si un nombre pair d'éléments est inclus dans le calcul médian (voir Tendance centrale: Solutions aux problèmes variationnels ).
la source