Zou et al. "Sur les" degrés de liberté "du lasso" (2007) montrent que le nombre de coefficients non nuls est une estimation non biaisée et cohérente des degrés de liberté du lasso.
Cela me semble un peu contre-intuitif.
- Supposons que nous ayons un modèle de régression (où les variables sont à moyenne nulle)
- Supposons qu'un OLS sans restriction estimation de est β O L S = 0,5 . Elle pourrait à peu près coïncider avec une estimation LASSO de β pour une intensité de pénalité très faible.
- Supposons en outre que l'estimation LASSO pour une intensité de pénalité particulière est β L A S S O , λ * = 0,4 . Par exemple, λ ∗ pourrait être le «optimal» λ pour l'ensemble de données à portée de main trouvé en utilisant la validation croisée.
- Si je comprends bien, dans les deux cas, les degrés de liberté sont de 1 car les deux fois il y a un coefficient de régression non nul.
Question:
- Comment viennent les degrés de liberté dans les deux cas sont les mêmes , même si β L A S S O , λ * = 0,4 suggère moins « liberté » dans l' ajustement de β O L S = 0,5 ?
Les références:
- Zou, Hui, Trevor Hastie et Robert Tibshirani. "Sur les" degrés de liberté "du lasso." The Annals of Statistics 35.5 (2007): 2173-2192.
regression
lasso
degrees-of-freedom
shrinkage
Richard Hardy
la source
la source
Réponses:
Supposons qu'on nous donne un ensemble de observations à p dimensions, x i ∈ R p , i = 1 , … , n . On suppose un modèle de la forme: Y i = ⟨ la ß , x i ⟩ + ε où ε ~ N ( 0 , σ 2 ) , la ß ∈ R p , et ⟨ ⋅ , ⋅ ⟩ désignant le produit scalaire. laissern p xi∈Rp i=1,…,n
En inspectant cette formule, nous pouvons supposer que, selon votre intuition, le vrai DOF pour le LASSO sera en effet inférieur au vrai DOF d'OLS; le retrait de coefficient effectué par le LASSO devrait tendre à diminuer les covariances.
Maintenant, pour répondre à votre question, la raison pour laquelle le DOF pour le LASSO est le même que le DOF pour OLS dans votre exemple est simplement que vous avez affaire à des estimations (quoique non biaisées), obtenues à partir d'un ensemble de données particulier échantillonné à partir du modèle , des vraies valeurs DOF. Pour tout ensemble de données particulier, une telle estimation ne sera pas égale à la vraie valeur (d'autant plus que l'estimation doit être un entier alors que la vraie valeur est un nombre réel en général).
la source