Pourquoi la perte de norme L2 a-t-elle une solution unique et la perte de norme L1 a-t-elle possiblement plusieurs solutions?

16

http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/

Si vous regardez en haut de cet article, l'auteur mentionne que la norme L2 a une solution unique et que la norme L1 a peut-être de nombreuses solutions. Je comprends cela en termes de régularisation, mais pas en termes d'utilisation de la norme L1 ou de la norme L2 dans la fonction de perte.

Si vous regardez les graphiques des fonctions de scalaire x (x ^ 2 et | x |), vous pouvez facilement voir que les deux ont une solution unique.

regression lasso regularization user3180
la source

2

"fnx"? ... Veuillez modifier pour rendre cela plus clair. Voulez-vous dire "fonctions"?

Glen_b -Reinstate Monica

25

Considérons un problème unidimensionnel pour une exposition la plus simple possible. (Les cas de dimension supérieure ont des propriétés similaires.)

$|x-\mu|$ $(x-\mu)^2$ $\sum_i |x_i-\mu|$ $x_1=1$ $x_2=3$

$\mu$

$L_1$

$\sum_i (x_i-\mu)^2 = n(\bar{x}-\mu)^2+k(\mathbf{x})$

$L_1$

Étant donné que (en dehors de certaines circonstances spécifiques), vous n'avez généralement aucune garantie d'une telle absence d'observations hautement influentes, je ne dirais pas que la régression L1 est robuste.

Code R pour le tracé:

 fi <- function(x,i=0) abs(x-i)
 f <- function(x) fi(x,1)+fi(x,3)
 plot(f,-1,5,ylim=c(0,6),col="blue",lwd=2)
 curve(fi(x,1),-1,5,lty=3,col="dimgrey",add=TRUE)
 curve(fi(x,3),-1,5,lty=3,col="dimgrey",add=TRUE)

Glen_b -Reinstate Monica
la source

C'est bien. Quel logiciel avez-vous utilisé pour créer le graphique?

user3180

2

R. Cela se fait uniquement dans les graphiques de base. J'ai ajouté le code à la fin de ma réponse.

Glen_b -Reinstate Monica

1

Woah, je n'ai jamais réalisé que tu pouvais fournir une fonction plot. Je suis épaté.

JAD

5

Minimiser la perte L2 correspond au calcul de la moyenne arithmétique, qui est sans ambiguïté, tandis que minimiser la perte L1 correspond au calcul de la médiane, qui est ambigu si un nombre pair d'éléments est inclus dans le calcul médian (voir Tendance centrale: Solutions aux problèmes variationnels ).

Bonjour au revoir
la source

Pourquoi la perte de norme L2 a-t-elle une solution unique et la perte de norme L1 a-t-elle possiblement plusieurs solutions?

Réponses: