Maintenant que j'ai une R
trame de données (formation), quelqu'un peut-il me dire comment diviser au hasard cet ensemble de données pour effectuer une validation croisée 10 fois?
cross-validation
user22062
la source
la source
Réponses:
caret
a une fonction pour cela:Ensuite, chaque élément de
flds
est une liste d'index pour chaque ensemble de données. Si votre jeu de données est appelédat
,dat[flds$train,]
vous obtenez le jeu d'entraînement,dat[ flds[[2]], ]
vous obtenez le deuxième jeu de plis, etc.la source
Voici un moyen simple d'effectuer 10 fois sans utiliser de packages:
la source
Probablement pas la meilleure façon, mais voici une façon de le faire. Je suis presque sûr que lorsque j'ai écrit ce code, j'avais emprunté une astuce à une autre réponse ici, mais je n'ai pas trouvé de lien.
la source
veuillez trouver ci-dessous un autre code que j'utilise (emprunté et adapté d'une autre source). Copié directement à partir d'un script que je viens d'utiliser moi-même, laissé dans la routine rpart. La partie probablement la plus intéressante est les lignes sur la création des plis. Alternativement - vous pouvez utiliser la fonction crossval du package bootstrap.
la source
Tout est fait pour vous en une seule ligne de code!
la source
Parce que je n'ai pas mon approche dans cette liste, j'ai pensé que je pourrais partager une autre option pour les personnes qui n'ont pas envie d'installer des packages pour une validation croisée rapide
Notez que le code ci-dessus suppose que les données sont déjà mélangées. Si ce n'était pas le cas, vous pourriez envisager d'ajouter quelque chose comme
la source