Existe-t-il un ensemble clair de conditions dans lesquelles le lasso, la crête ou les chemins de solution nette élastique sont monotones?

18

La question Que conclure de ce graphique du lasso (glmnet) montre des chemins de solution pour l'estimateur du lasso qui ne sont pas monotones. C'est-à-dire que certains des coefficients augmentent en valeur absolue avant de rétrécir.

J'ai appliqué ces modèles à plusieurs types d'ensembles de données et je n'ai jamais vu ce comportement "dans la nature", et jusqu'à aujourd'hui j'avais supposé qu'ils étaient toujours monotones.

Existe-t-il un ensemble clair de conditions dans lesquelles les chemins de solution sont garantis monotones? Cela affecte-t-il l'interprétation des résultats si les chemins changent de direction?

shadowtalker
la source
Monotone dans quel sens? Cela ne me semble pas très significatif si vous voulez le traiter comme un graphique d'une fonction.
Henry.L
4
@ Henry.L La question peut être reformulée comme suit: quand est-ce vrai: pour , nous avons cela pour tout , où . Autrement dit, le lasso rétrécit uniformément par composant. Pourriez-vous, s'il vous plaît, clarifier ce qui, selon vous, est significatif? λ1λ2(β^λ2)j(β^λ1)jjβ^λ=argminβ12nyXβ22+λβ1
user795305
2
note: comprendre la façon dont le lasso réduit les coefficients est le sujet de cette question et de stats.stackexchange.com/questions/145299/…
user795305
1
Je ne sais pas comment j'ai manqué cela auparavant, la question est répondue au lasso sur la réponse du PO à sa propre question dans la question ci-dessus.
user795305

Réponses:

2

Je peux vous donner une suffisante condition pour le chemin d'accès monotones: une conception orthonormé X .

Supposons une matrice de conception orthonormée, c'est-à-dire qu'avec variables dans , nous avons . Avec un plan orthonormé, les coefficients de régression OLS sont simplement .X X XpX β olde=X'l'yXXn=Ipβ^ols=Xyn

Les conditions de Karush-Khun-Tucker pour le LASSO se simplifient donc pour:

Xyn=β^lunesso+λsβ^ols=β^lunesso+λs

Où est le sous-gradient. Par conséquent, pour chaque nous avons , et nous avoir une solution sous forme fermée aux estimations du lasso:j { 1 , ... , p } β o l de j = β l a s s o j + λ s jsj{1,,p}β^jols=β^jlunesso+λsj

β^jlunesso=sjegn(β^jols)(|β^jols|-λ)+

Qui est monotone dans . Bien que ce n'est pas une condition nécessaire, nous voyons que la non-monotonicité doit provenir de la corrélation des variables dans .XλX

Carlos Cinelli
la source