Je comprends théoriquement (en quelque sorte) comment ils fonctionneraient, mais je ne sais pas comment faire pour utiliser une méthode d'ensemble (comme le vote, les mélanges pondérés, etc.).
- Quelles sont les bonnes ressources pour mettre en œuvre des méthodes d'ensemble?
- Existe-t-il des ressources particulières concernant l'implémentation en Python?
ÉDITER:
Pour éclaircir certains sur la base de la discussion sur les commentaires, je ne cherche pas d'algorithmes d'ensemble tels que randomForest, etc. Au lieu de cela, je me demande comment pouvez-vous combiner différentes classifications de différents algorithmes.
Par exemple, supposons que quelqu'un utilise la régression logistique, le SVM et d'autres méthodes pour prédire la classe d'une certaine observation. Quelle est la meilleure façon de capturer la meilleure estimation de la classe basée sur ces prédictions?
la source
«Méthodes d'ensemble dans l'exploration de données: améliorer la précision en combinant les prédictions», Seni et Elder - Excellente référence sur la théorie et la mise en œuvre d'ensemble pratique, mais le code d'accompagnement est basé sur R.
«Machine Learning: An Algorithmic Perspective», S. Marsland - Excellent texte pratique basé sur Python, mais pas aussi dédié aux concepts d'ensemble purs que la première référence.
la source
La réponse de Stumpy Joe Pete était parfaite, mais comme vous avez parlé d'une implémentation de Python, je voulais mentionner le projet de brassage de l'Universidade Federal de Pernambuco.
https://github.com/viisar/brew
À ce stade, ils ont la génération d'ensemble, la combinaison, l'élagage et la sélection dynamique.
Limitations: classification uniquement; pas d'empilement dans la version publique actuelle; pas beaucoup de documentation.
la source
Salford Systems a un progiciel appelé Random Forests qui l'implémente pour les ensembles d'arbres de classification et de régression. Je n'ai aucun forfait R gratuit à offrir. J'imagine qu'ils ont un manuel d'utilisation qui expliquera leur mise en œuvre. Par analogie, vous pourriez probablement trouver comment le faire pour d'autres méthodes d'ensemble.
la source
J'ai trouvé ce tutoriel qui m'a été extrêmement utile. Il ne répond pas à toutes les pièces mais je pense que c'est un bon début de discussion: http://vikparuchuri.com/blog/intro-to-ensemble-learning-in-r/
la source
Le guide d'assemblage Scikit-learn fournit l' ensachage et le renforcement des méta-classificateurs et des régresseurs. De plus, la bibliothèque mlxtend fournit des implémentations de méta-classificateurs et régresseurs d' empilement .
la source