Pour les devoirs, on m'a donné des données pour créer / former un prédicteur qui utilise la régression au lasso. Je crée le prédicteur et je l'entraîne à l'aide de la bibliothèque lasso python de scikit learn.
Alors maintenant, j'ai ce prédicteur qui, une fois donné, peut prédire la sortie.
La deuxième question consistait à "étendre votre prédicteur pour rendre compte de l'intervalle de confiance de la prédiction en utilisant la méthode d'amorçage".
J'ai regardé autour de moi et j'ai trouvé des exemples de personnes faisant cela pour la moyenne et d'autres choses.
Mais je suis complètement perdu sur la façon dont je suis censé le faire pour une prédiction. J'essaie d'utiliser la bibliothèque scikit-bootstrap .
Le personnel du cours est extrêmement insensible, donc toute aide est appréciée. Je vous remercie.
Réponses:
Le bootstrapping fait référence au rééchantillonnage de vos données avec remplacement. Autrement dit, au lieu d'adapter votre modèle aux X et y d'origine, vous adaptez votre modèle aux versions rééchantillonnées de X et y plusieurs fois.
Ainsi, vous obtenez n modèles légèrement différents que vous pouvez utiliser pour créer un intervalle de confiance. Voici un exemple visuel d'un tel intervalle.
la source
Si vous souhaitez utiliser l'API de scikit pour la partie bootstrap du code:
la source