CARET utilisera automatiquement une grille de réglage prédéfinie pour construire divers modèles avant de sélectionner un modèle final, puis d'entraîner le modèle final sur les données d'entraînement complètes. Je peux fournir ma propre grille de réglage avec une seule combinaison de paramètres. Cependant, même dans ce cas, CARET "sélectionne" le meilleur modèle parmi les paramètres de réglage (même s'il n'y en a qu'un dans ce cas), puis ajuste le modèle final à toutes les données d'entraînement. C'est une étape supplémentaire que j'aimerais éviter.
Comment puis-je simplement ignorer l'étape de recherche de modèle parmi les variations de la grille de réglage et forcer CARET à s'appuyer sur toutes les données de formation (autre que d'appeler directement la bibliothèque de modèles sous-jacente)?
Réponses:
Vous pouvez spécifier
method="none"
danstrainControl
. Par exemple:Je ne sais pas quand cela a été mis en œuvre.
la source
La meilleure façon serait de fournir explicitement la trame de données tuneGrid. Par exemple, la forêt aléatoire n'a qu'un seul paramètre de réglage, «mtry», qui contrôle le nombre d'entités sélectionnées pour chaque arbre.
Pour définir mtry à une valeur spécifique, vous pouvez choisir la valeur par défaut randomForest (? RandomForest), procédez comme suit:
où M est la seule valeur du paramètre de réglage que vous souhaitez utiliser.
pour plusieurs paramètres de réglage, procédez comme suit:
la source
method="none"
- dessous est la meilleure solution.Je ne pense pas que ce soit possible (du moins ce n'était pas possible il y a quelques versions). On peut réduire l'impact sur les performances en configurant une seule partition de rééchantillonnage dans les données de formation (mais le curseur entraînerait toujours un modèle deux fois)
Cela ressemble à une fonctionnalité utile à avoir, donc je cinglerais l'auteur du paquet.
la source