Je régresse un prédicteur continu sur plus de 60 variables (à la fois continues et catégorielles) en utilisant LASSO (glmnet).
En examinant le tracé de trace variable, je remarque que lorsque le log lambda augmente, l'une des variables clés a un coefficient qui augmente réellement. Puis, après un certain point, il commence à diminuer comme on pourrait s'y attendre.
Pour m'assurer que ce n'était pas un coup de chance, j'ai exécuté 10 modèles à l'aide de bootstraps et obtenu des résultats très similaires.
Est-ce possible ou y a-t-il un problème avec les données? Si elle est légitime, que nous apprend cette tendance du coefficient de la variable sur la variable et la relation avec la réponse?
la source