experts! Peut-être, vous savez comment calculer l'intervalle de confiance pour xgboost? La formule classique avec t-distribution ne peut pas aider, car mes données ne sont pas normalement distribuées. Ou n'a pas d'importance?
Si vous proposez de la littérature, ce sera très utile, mais les approches en R et Python (dans le contexte de la bibliothèque xgb) sont également bonnes.
Peut-être, ça ressemble à ça , mais comment ça se calcule? Et j'ai trouvé ça - c'est vrai ou pas?
PS: Je ne peux pas ajouter de photos liées à mes données (limite de liens), désolé.
confidence-interval
xgboost
Lu Wao
la source
la source
Réponses:
Voilà donc la réponse! ( miroir )
Pour établir des limites de confiance pour les données distribuées anormalement, vous devez d'abord créer une régression quantile, plutôt qu'une régression linéaire, comme c'est le cas par défaut. Pour cela il est nécessaire, en utilisant les dérivés dérivés de l'article ou simplement en copiant le code sur le python, de personnaliser la variable 'objectif'. Il est également nécessaire de changer la fonction de gradient et la fonction gaussienne. Une fois que tout est programmé, créez une régression quantile pour le 50e quantile (ce sera la régression initiale), puis deux régressions quantiles pour les deux limites de l'intervalle (par exemple, 95 et 5). En conséquence, vous obtenez non seulement un modèle plus précis pour la régression initiale, mais également les intervalles souhaités.
la source