Dans -SVR, le paramètre est utilisé pour déterminer la proportion du nombre de vecteurs de support que vous souhaitez conserver dans votre solution par rapport au nombre total d'échantillons dans l'ensemble de données. Dans -SVR, le paramètre est introduit dans la formulation du problème d'optimisation et il est estimé automatiquement (de manière optimale) pour vous.νννϵ
Cependant, dans -SVR, vous n'avez aucun contrôle sur le nombre de vecteurs de données de l'ensemble de données qui deviennent des vecteurs de support, cela peut être quelques-uns, cela peut être plusieurs. Néanmoins, vous aurez un contrôle total sur la quantité d'erreur que vous autoriserez à votre modèle, et tout ce qui dépasse le spécifié sera pénalisé proportionnellement à , qui est le paramètre de régularisation.ϵϵC
Selon ce que je veux, je choisis entre les deux. Si je suis vraiment à la recherche d'une petite solution (moins de vecteurs de support), je choisis -SVR et j'espère obtenir un modèle décent. Mais si je veux vraiment contrôler la quantité d'erreur dans mon modèle et opter pour les meilleures performances, je choisis -SVR et j'espère que le modèle n'est pas trop complexe (beaucoup de vecteurs de support).νϵ
J'aime les réponses de Pablo et Marc. Un point supplémentaire:
Dans l'article cité par Marc, il est écrit (section 4)
[...]
Qu'est-ce que tu penses?
la source