J'ai effectué un lasso, puis laissé une validation croisée
cv<-cv.glmnet(df, df$Price, nfolds = 1500)
Lorsque je trace un cv, j'obtiens ce qui suit:
J'ai aussi remarqué que j'obtenais 2 lambdas différents: lambda.min
etlambda.1se
- Quelle est la différence entre ces lambdas?
- Que puis-je comprendre de l'intrigue ci-dessus en général (à quoi servent ces intervalles de confiance, quelles sont les deux lignes pointillées, etc.)?
Si je change pour nfolds=10
effectuer une validation 10 fois, j'obtiens lambda.1se
des coefficients différents et différents pour cette lambda. Sur la base de quels critères puis-je choisir le meilleur pour moi?
Réponses:
Il ne s'agit pas vraiment de statistiques, il suffit de lire la documentation.
la source