Je me retrouve souvent à former plusieurs modèles prédictifs différents en utilisant caret
R. Je vais tous les former sur les mêmes plis de validation croisée, en utilisant caret::: createFolds
, puis en choisissant le meilleur modèle basé sur une erreur de validation croisée.
Cependant, la prédiction médiane de plusieurs modèles surpasse souvent le meilleur modèle unique sur un ensemble de test indépendant. Je pense à écrire certaines fonctions pour empiler / assembler des modèles de curseur formés avec les mêmes plis de validation croisée, par exemple en prenant des prédictions médianes de chaque modèle sur chaque pli, ou en formant un «méta-modèle».
Bien sûr, cela pourrait nécessiter une boucle de validation croisée externe. Quelqu'un connaît-il des packages / codes open source existants pour assembler des modèles de curseur (et éventuellement valider ces ensembles)?
Ce que vous recherchez est appelé "assemblage de modèle". Un didacticiel d'introduction simple avec le code R peut être trouvé ici: http://viksalgorithms.blogspot.jp/2012/01/intro-to-ensemble-learning-in-r.html
la source
Je ne sais pas trop ce que vous cherchez mais cela pourrait aider: http://www.jstatsoft.org/v28/i05/paper
C'est comment utiliser plusieurs modèles dans caret. La partie qui pourrait vous intéresser est la section 5 de la p. 13.
la source