Je travaille actuellement sur la construction d'un modèle prédictif pour un résultat binaire sur un ensemble de données avec environ 300 variables et 800 observations. J'ai beaucoup lu sur ce site sur les problèmes liés à la régression pas à pas et pourquoi ne pas l'utiliser.
J'ai lu la régression LASSO et sa capacité de sélection de fonctionnalités et j'ai réussi à l'implémenter avec l'utilisation du package "caret" et de "glmnet".
Je suis capable d'extraire le coefficient du modèle avec l'optimal lambda
et alpha
de "caret"; cependant, je ne sais pas comment interpréter les coefficients.
- Les coefficients LASSO sont-ils interprétés selon la même méthode que la régression logistique?
- Serait-il approprié d'utiliser les caractéristiques sélectionnées de LASSO dans la régression logistique?
ÉDITER
Interprétation des coefficients, comme dans les coefficients exponentiels de la régression LASSO comme les cotes logarithmiques pour un changement de 1 unité du coefficient tout en maintenant tous les autres coefficients constants.
la source
Réponses:
Permettez-moi de reformuler: les coefficients LASSO sont-ils interprétés de la même manière que, par exemple, les coefficients de vraisemblance maximale
OLSdans une régression logistique?LASSO (une méthode d'estimation pénalisée) vise à estimer les mêmes quantités (coefficients du modèle) que, par exemple, le maximum de vraisemblance
OLS(une méthode non pénalisée). Le modèle est le même et l'interprétation reste la même. Les valeurs numériques de LASSO seront normalement différentes de celles du maximum de vraisemblanceOLS: certaines seront plus proches de zéro, d'autres seront exactement nulles. Si une pénalisation raisonnable a été appliquée, les estimations LASSO se situeront plus près des valeurs réelles que les estimations du maximum de vraisemblanceOLS, ce qui est un résultat souhaitable.Il n'y a pas de problème inhérent à cela, mais vous pouvez utiliser LASSO non seulement pour la sélection des fonctionnalités mais également pour l'estimation des coefficients. Comme je l'ai mentionné ci-dessus, les estimations de LASSO peuvent être plus précises que, disons, les estimations du maximum de vraisemblance de l'
OLS.la source