Considérez la régression linéaire avec une certaine régularisation: par exemple, trouver qui minimise
Habituellement, les colonnes de A sont normalisées pour avoir une moyenne et une norme unitaire nul, tandis que est centrée pour avoir une moyenne nulle. Je veux m'assurer que ma compréhension de la raison de la normalisation et du centrage est correcte.
En rendant les moyennes des colonnes de et nul, nous n'avons plus besoin d'un terme d'interception. Sinon, l'objectif aurait été . En rendant les normes des colonnes de A égales à 1, nous supprimons la possibilité d'un cas où, simplement parce qu'une colonne de A a une norme très élevée, elle obtient un faible coefficient en , ce qui pourrait nous amener à conclure à tort que cette colonne de A ne pas « expliquer » bien.
Ce raisonnement n'est pas exactement rigoureux mais intuitivement, est-ce la bonne façon de penser?
$x$ does not ''explain'' $A$ well
, et tu veux direx does not ''explain'' $A$ at all
? est les données tandis que x est le modèle dans ce cas.