La documentation indique que R gbm avec distribution = "adaboost" peut être utilisé pour un problème de classification 0-1. Considérez le fragment de code suivant:
gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000)
gbm_predicted <- predict(gbm_algorithm, test_dataset, n.trees = 5000)
Il peut être trouvé dans la documentation que Predict.gbm
Renvoie un vecteur de prédictions. Par défaut, les prédictions sont à l'échelle de f (x).
Cependant l'échelle particulière n'est pas claire pour le cas de distribution = "adaboost".
Quelqu'un pourrait-il aider à l'interprétation des valeurs de retour de Predict.gbm et donner une idée de la conversion en sortie 0-1?
Réponses:
La méthode adaboost donne les prédictions à l'échelle logit. Vous pouvez le convertir en sortie 0-1:
notez le 2 * à l'intérieur du logis
la source
Vous pouvez également obtenir directement les probabilités de la
predict.gbm
fonction;la source
La fonction de liaison adaboost est décrite ici . Cet exemple fournit une description détaillée du calcul:
la source