Lorsque je détermine mon lambda par validation croisée, tous les coefficients deviennent nuls. Mais j'ai quelques indices dans la littérature que certains des prédicteurs devraient définitivement affecter le résultat. Est-ce une foutaise de choisir arbitrairement lambda pour qu'il y ait autant de parcimonie qu'on le souhaite?
Je veux sélectionner les 10 premiers prédicteurs sur 135 pour un modèle cox et les tailles d'effet sont malheureusement petites.
Réponses:
la source
Il existe une bonne façon d'effectuer LASSO mais utilisez un nombre fixe de prédicteurs. C'est la régression du moindre angle (LAR ou LARS) décrite dans l'article d'Efron. Pendant la procédure itérative, il crée un certain nombre de modèles linéaires, chaque nouveau a un prédicteur de plus, vous pouvez donc en sélectionner un avec le nombre de prédicteurs souhaité.
la source
La théorie du lasso repose sur le fait que le paramètre de régularisation est suffisamment grand pour rendre le modèle sélectionné suffisamment clairsemé. Il se peut que vos 10 fonctionnalités soient trop nombreuses ou trop peu nombreuses, car il n'est pas trivial de transformer une borne inférieure sur en borne supérieure sur.λ | S ∗ |λ λ |S∗|
Soit notre estimation basée sur les données pour , et mettons . Alors, peut-être que vous essayez de vous assurer que afin que vous ayez récupéré au moins les fonctionnalités pertinentes? Ou peut-être que vous essayez d'établir ce afin que vous sachiez que les fonctionnalités que vous avez trouvées valent toutes la peine? Dans ces cas, votre procédure serait plus justifiée si vous disposiez d'informations préalables sur les tailles relatives de . la ß * S ={jβ^ β∗ S* ⊆ S S ⊆S*S*S^={j:β^j≠0} S∗⊆S^ S^⊆S∗ S∗
Notez également, vous pouvez laisser des coefficients unpenalized lors de l' exécution Lasso, par exemple,
glmnet
.la source