Quelle est la signification des barres doubles et 2 en bas dans les moindres carrés ordinaires?

10

J'ai vu cette notation pour les moindres carrés ordinaires ici .

minwXwy22

Je n'ai jamais vu les doubles barres et les 2 en bas. Que signifient ces symboles? Ont-ils une terminologie spécifique pour eux?

Aseem Bansal
la source
5
L'utilisation des barres doubles indique simplement que nous utilisons la norme L2.
Michael R. Chernick
@MichaelChernick et les 2? Cela fait-il partie de la «norme L2»?
Aseem Bansal
1
Oui, comme L2, il y a aussi L1.
Jon
Je pense que Xw devrait être Xw car w est un vecteur
ilanman
@ilanman Oui, c'est ce qui était dans la notation avant l'édition. Je l'ai changé de nouveau
Aseem Bansal

Réponses:

29

Vous parlez de la -norm (norme euclidienne) du vecteur ( ). Si cela vous est étranger, brièvement, la -norm d'un vecteur , est:2XwypuRn

up=(i=1n|ui|p)1p

Donc dans votre cas qui est cohérent avec la somme des résidus au carré pour une régression linéaire. Dans le contexte des problèmes de régression, vous le verrez également beaucoup dans les calculs d'erreur quadratique moyenne (MSE) et dans la régression de crête .u22=((i=1n|ui|2)12)2=i=1nui2

Ceci est une norme courante (entre autres raisons, c'est mathématiquement pratique), donc quand c'est évident d'après le contexte, vous verrez les inférieurs omis, et juste .2u2

Comme mentionné dans les commentaires, vous pouvez également voir la -norm:1

u1=i=1n|ui|

Ce qui correspond à la valeur absolue. Encore une fois, vous verrez cela dans des problèmes d'erreur absolue moyenne (MAE) ou de lasso .

Autres normes populaires:

  • 0 -norm: distance de Hamming , ou nombre de non-zéros dans un vecteur, c'est-à-dire dans le calcul de la rareté d'un vecteur. Techniquement, ce n'est pas une norme (c'est une fonction de cardinalité), car vous avez un terme dans la définition, mais il a la forme d'une norme, nous l'appelons donc un. 10
    • Cette norme est la norme idéale utilisée pour induire la rareté des problèmes de régression, car nous voulons vraiment mettre à zéro les coefficients, mais le calcul de la régularisation est NP-difficile, donc nous l'approximons avec qui peut être résolu par programmation linéaire. Il est également populaire dans la détection compressée .01
  • -norm: = pourmaxi {|xi|}i=1,...,n
  • AF : Norme Frobenius (euclidienne), appliquée à une matriceARn×m=i=1nj=1m|aij|2
ilanman
la source
2
Le lien vers wolfram alpha était vraiment utile.
Aseem Bansal
Vous écrivez que la (pseudo) compte le nombre de zéros dans un vecteur - pensiez-vous peut-être le nombre d' entrées non nulles? (Cela serait plus cohérent avec ce que j'ai vu et signifierait également que serait la distance de Hamming entre et , au lieu d'être moins que distance.)0u0u0Rnn
wchargin
1
Erreur d'orthographe: "Frobenius".
Hobbs
1
Au lieu de "c'est une norme commune", j'aurais juste dit "L2 est la norme";)
user541686