J'utilise SVM pour la classification et j'essaie de déterminer les paramètres optimaux pour les noyaux linéaires et RBF. Pour le noyau linéaire, j'utilise la sélection de paramètres à validation croisée pour déterminer C et pour le noyau RBF, j'utilise la recherche de grille pour déterminer C et gamma.
J'ai 20 fonctionnalités (numériques) et 70 exemples de formation qui devraient être classés en 7 classes.
Quelle plage de recherche dois-je utiliser pour déterminer les valeurs optimales pour les paramètres C et gamma?
Consultez la section 2.3.2 de cet article de Chapelle et Zien. Ils ont une bonne heuristique pour sélectionner une bonne plage de recherche pour du noyau RBF et pour SVM. Je citeσ C
Ensuite, ils utilisent des multiples (par exemple pour ) de la valeur par défaut comme plage de recherche dans une recherche de grille utilisant la validation croisée. Cela a toujours très bien fonctionné pour moi.2k k∈{−2,...,2}
Bien sûr, nous avons dit @ciri, normaliser les données, etc. est toujours une bonne idée.
la source