Arbres de décision boostés calibrés dans R ou MATLAB

8

Dans An Empirical Comparison of Supervised Learning Algorithms (ICML 2006), les auteurs (Rich Caruana et Alexandru Niculescu-Mizil) ont évalué plusieurs algorithmes de classification (SVM, ANN, KNN, Random Forests, Decision Trees, etc.) et ont rapporté que les arbres boostés calibrés classé comme le meilleur algorithme d'apprentissage global sur huit mesures différentes (score F, zone ROC, précision moyenne, entropie croisée, etc.).

Je voudrais tester des arbres de décision boostés calibrés dans l'un de mes projets, et je me demandais si quelqu'un pouvait suggérer un bon package R ou une bibliothèque MATLAB pour cela.

Je suis relativement nouveau dans R, même si j'ai une grande expérience avec MATLAB et Python. J'ai lu à propos de gbm , de l' arbre et de rpart de R , mais je ne sais pas si ces packages implémentent des arbres de décision boostés calibrés ou s'il y en a d'autres qui les implémentent.

Merci

Amelio Vazquez-Reina
la source

Réponses:

3

À propos de R, je voterais pour le paquet gbm ; il y a une vignette qui donne un bon aperçu: Modèles généralisés boostés: Un guide du paquet gbm . Si vous recherchez une interface unifiée pour les algorithmes ML, je recommande le package caret qui dispose de fonctionnalités intégrées pour le prétraitement des données, le rééchantillonnage et l'évaluation comparative des performances du modèle. D'autres packages pour les arbres boostés sont rapportés dans le tableau 1 de l'une de ses vignettes d'accompagnement, Réglage du modèle, prédiction et fonctions de performance . Il y a aussi un exemple de réglage des paramètres pour les arbres boostés dans l' article JSS , pp. 10-11.

Remarque: je n'ai pas vérifié, mais vous pouvez également consulter Weka (il existe une interface R, RWeka ).

chl
la source
1
Merci @chl. Je vais les regarder. Savez-vous si l'un de ces packages fournit des sorties calibrées? (c.-à-d. probabilités calibrées, plutôt que de simples scores)
Amelio Vazquez-Reina
1
J'ai compris que la question était: "Des méthodes de mise à l'échelle de plateaux ou de régression isotonique ont-elles été mises en œuvre dans R?"
charles
@ user023472 Avez-vous déjà trouvé une réponse à ce problème?
charles