Relation LASSO entre et

10

Ma compréhension de la régression LASSO est que les coefficients de régression sont sélectionnés pour résoudre le problème de minimisation:

minβyXβ22 s.t.β1t

En pratique, cela se fait en utilisant un multiplicateur de Lagrange, ce qui rend le problème à résoudre

minβyXβ22+λβ1

Quelle est la relation entre λ et t ? Wikipédia déclare simplement que cela "dépend des données".

Pourquoi je m'inquiète? D'abord pour la curiosité intellectuelle. Mais je suis également préoccupé par les conséquences de la sélection de λ par validation croisée.

Plus précisément, si je fais une validation croisée n fois, j'adapte n modèles différents à n partitions différentes de mes données d'entraînement. Je compare ensuite la précision de chacun des modèles sur les données inutilisées pour un \ lambda donné λ. Mais le même λ implique une contrainte différente ( t ) pour différents sous-ensembles de données (c'est-à-dire que t=f(λ) est "dépendant des données").

Le problème de validation croisée que je veux vraiment résoudre n'est-il pas vraiment de trouver le t qui offre le meilleur compromis précision-biais?

Je peux avoir une idée approximative de la taille de cet effet dans la pratique en calculant pour chaque division de validation croisée et et en regardant la distribution résultante. Dans certains cas, la contrainte implicite ( ) peut varier considérablement de manière silencieuse dans mes sous-ensembles de validation croisée. Où j'entends essentiellement le coefficient de variation de .β1λtt>>0

ConstantAmateur
la source
5
Voter pour annuler le downvote inexpliqué. La question est bien en dehors de mon expertise mais elle semble raisonnablement formulée.
mkt

Réponses:

2

Ceci est la solution standard pour la régression des crêtes :

β=(XX+λI)1Xy

Nous savons également que , il doit donc être vrai queβ=t

(XX+λI)1Xy=t
.

ce qui n'est pas facile à résoudre pour .λ

Votre meilleur pari est de continuer à faire ce que vous faites: calculer sur le même sous-échantillon des données à travers plusieurs valeurs .tλ

shadowtalker
la source