En commençant par la formulation du problème de régression des crêtes comme
min∥Xβ−y∥22+λ∥x∥22
vous pouvez écrire le problème comme
min∥Aβ−b∥22
où
A=[Xλ−−√I]
et
b=[y0].
La matrice est de rang complet de la colonne à cause de la partie. Ainsi, le problème des moindres carrés comme solution uniqueAλ−−√I
β^=(ATA)−1ATb
En écrivant ceci en termes de et , et en simplifiant beaucoup de 0, nous obtenonsXy
β^=(XTX+λI)−1XTy
Rien dans cette dérivation ne dépend si a plus de lignes ou de colonnes, ou même si a un rang complet. Cette formule est donc applicable au cas indéterminé. XX
C'est un fait algébrique que pour ,λ>0
(XTX+λI)−1XT=XT(XXT+λI)−1
Ainsi, nous avons également la possibilité d'utiliser
β^=XT(XXT+λI)−1y .
Pour répondre à vos questions spécifiques:
Oui, les deux formules fonctionnent pour le cas indéterminé ainsi que pour le cas surdéterminé. Ils ont également le travail si est inférieur au minimum du nombre de lignes et de colonnes de . La deuxième version peut être plus efficace pour les problèmes indéterminés car est plus petit que dans ce cas. rank(X)XXXTXTX
Je ne suis au courant d'aucune dérivation de la version alternative de la formule qui commence par un autre problème des moindres carrés amortis et utilise les équations normales. Dans tous les cas, vous pouvez le dériver de manière simple en utilisant un peu d'algèbre.
Il est possible que vous pensiez au problème de régression des crêtes sous la forme
min∥β∥22
sujet à
∥Xβ−y∥22≤ϵ.
Cependant, cette version du problème de régression des crêtes conduit simplement au même problème des moindres carrés amortis .min∥Xβ−y∥22+λ∥β∥22