Comme vous le savez, il existe deux types populaires de validation croisée, le pliage en K et le sous-échantillonnage aléatoire (comme décrit dans Wikipedia ). Néanmoins, je sais que certains chercheurs rédigent et publient des articles où quelque chose qui est décrit comme un CV plié en K est en effet un sous-échantillonnage aléatoire, donc dans la pratique, vous ne savez jamais ce qui se trouve réellement dans l'article que vous lisez.
Habituellement, bien sûr, la différence est imperceptible, et ainsi va ma question - pouvez-vous penser à un exemple où le résultat d'un type est significativement différent d'un autre?
9
Je ne suis pas du tout sûr que la différence soit imperceptible, et que ce n'est que dans un exemple ad hoc qu'elle sera perceptible. Les méthodes de validation croisée et de bootstrap (sous-échantillonnage) dépendent de manière critique de leurs paramètres de conception, et cette compréhension n'est pas encore terminée. En général, les résultats dans k fois la validation croisée dépendent essentiellement du nombre de plis, de sorte que vous pouvez toujours attendre des résultats différents de ce que vous observer dans le sous-échantillonnage.
Exemple: disons que vous avez un vrai modèle linéaire avec un nombre fixe de paramètres. Si vous utilisez la validation croisée k-fold (avec un k donné, fixe) et laissez le nombre d'observations aller à l'infini, la validation croisée k-fold sera asymptotiquement incohérente pour la sélection du modèle, c'est-à-dire qu'elle identifiera un modèle incorrect avec probabilité supérieure à 0. Ce résultat surprenant est dû à Jun Shao, "Linear Model Selection by Cross-Validation", Journal of the American Statistical Association , 88 , 486-494 (1993), mais d'autres articles peuvent être trouvés dans cette veine.
En général, des articles statistiques respectables spécifient le protocole de validation croisée, précisément parce que les résultats ne sont pas invariants. Dans le cas où ils choisissent un grand nombre de plis pour de grands ensembles de données, ils remarquent et tentent de corriger les biais dans la sélection du modèle.
la source