Comme j'ai entendu parler du classificateur AdaBoost à plusieurs reprises au travail, je voulais avoir une meilleure idée de son fonctionnement et du moment où on pourrait l'utiliser. Je suis allé de l'avant et j'ai lu un certain nombre d'articles et de didacticiels que j'ai trouvés sur Google, mais il y a des aspects du classificateur que j'ai encore du mal à comprendre:
La plupart des didacticiels que j'ai vus parlent d'AdaBoost comme de la meilleure combinaison pondérée de nombreux classificateurs. Cela me semble logique. Ce qui n'a pas de sens, ce sont les implémentations (c'est-à-dire MALLET) où AdaBoost semble n'accepter qu'un seul apprenant faible. Comment cela a-t-il un sens? S'il n'y a qu'un seul classificateur fourni à AdaBoost, ne devrait-il pas simplement renvoyer ce même classificateur avec un poids de 1? Comment produit-il de nouveaux classificateurs à partir du premier classificateur?
Quand voudrait-on réellement utiliser AdaBoost? J'ai lu qu'il était censé être l'un des meilleurs classificateurs prêts à l'emploi, mais lorsque j'essaie d'augmenter un classificateur MaxEnt, j'obtenais des scores f de 70% +, AdaBoost le tue et me donne f- scores de quelque chose comme 15% avec un rappel très élevé et une très faible précision à la place. Alors maintenant, je suis confus. Quand voudrais-je jamais utiliser AdaBoost? Je cherche plus d'une réponse intuitive plutôt que strictement statistique, si possible.
la source