Une norme est unique (au moins en partie) car est à la frontière entre non convexe et convexe. Une norme est la norme convexe «la plus clairsemée» (non?).
Je comprends que la norme euclidienne a ses racines dans la géométrie et elle a une interprétation claire lorsque les dimensions ont les mêmes unités. Mais je ne comprends pas pourquoi il est utilisé préférentiellement par rapport aux autres nombres réels p > 1 : p = 1,5 ? p = π ? Pourquoi ne pas utiliser toute la gamme continue comme hyperparamètre?
Qu'est-ce que je rate?
regression
regularization
sparse
Trenton
la source
la source
Réponses:
Une explication plus mathématique est que l'espace , composé de toutes les séries qui convergent en p-norme, n'est que Hilbert avec p = 2 et aucune autre valeur. Cela signifie que cet espace est complet et que la norme sur cet espace peut être induite par un produit intérieur (pensez au produit scalaire familier danslp p=2 ), donc c'est un peu plus agréable de travailler avec.Rn
la source
Voici quelques raisons:
Il est lié d'une manière très spéciale au produit intérieur: c'est sa propre norme double (c'est-à-dire qu'il est "auto-dual").ℓ2 z ℓ2 z ∥x∥22=x⋅x ℓp
Cela signifie que, si vous considérez tous les vecteurs à l'intérieur de la boule d'unité , leur produit intérieur maximal avec tout vecteur z est la norme ℓ 2 de z lui-même. De façon moins imaginaire, il satisfait la propriété que ‖ x ‖ 2 2 = x ⋅ x . Aucune autre norme ℓ p ne se comporte de cette façon.
Il a un gradient lisse très pratique:
la source
Bien qu'il puisse y avoir beaucoup plus de raisons, AFAIK p = 2 est préféré pour les raisons suivantes:
la source
Les erreurs quadratiques sous les modèles linéaires sont souvent préférées en raison de:
la source