Je suppose que vous entendez la sélection des fonctionnalités comme une ingénierie des fonctionnalités . Le processus que je suis habituellement et je vois que certaines personnes font est
- Ingénierie des fonctionnalités
Essayez quelques algorithmes, généralement très performants tels que RandomForest, Gradient Boosted Trees, Neutral Networks ou SVM sur les fonctionnalités.
2.1 Effectuer un réglage simple des paramètres, comme une recherche dans la grille sur une petite plage de paramètres
Si le résultat de l'étape 2 n'est pas satisfaisant, revenez à l'étape 1 pour générer plus de fonctionnalités, ou supprimez les fonctionnalités redondantes et conservez les meilleures, les gens appellent généralement cette sélection de fonctionnalités . Si vous manquez d'idées pour de nouvelles fonctionnalités, essayez plus d'algorithmes.
Si le résultat est correct ou proche de ce que vous voulez, passez à l'étape 3
- Réglage approfondi des paramètres
La raison de cela est que la classification est une question d'ingénierie des fonctionnalités , et à moins que vous ne connaissiez un classificateur incroyablement puissant tel qu'un apprentissage en profondeur personnalisé pour un problème particulier, comme la vision par ordinateur. Générer de bonnes fonctionnalités est la clé. Le choix d'un classificateur est important mais pas crucial. Tous les classificateurs mentionnés ci-dessus sont assez comparables en termes de performances, et la plupart du temps, le meilleur classificateur se révèle être l'un d'entre eux.
Le réglage des paramètres peut augmenter considérablement les performances, dans certains cas. Mais sans bonnes fonctionnalités, le réglage n'aide pas beaucoup. Gardez à l'esprit que vous avez toujours le temps de régler les paramètres. En outre, il est inutile de régler les paramètres de manière approfondie, puis vous découvrez une nouvelle fonctionnalité et refaites le tout.