Je cherche une référence à l'article où la validation croisée k-fold a été introduite (plutôt qu'une simple bonne référence académique pour le sujet). Il est peut-être trop loin dans la nuit des temps pour identifier sans ambiguïté le tout premier article, de sorte que tous les premiers articles où l'idée a été utilisée seraient intéressants.
Les premiers que je connaisse sont
PA Lachenbruch et MR Mickey, «Estimation des taux d'erreur dans l'analyse discriminante», Technometrics, vol. 10, non. 1, p. 1–12, février 1968.
et
A. Luntz et V. Brailovsky, «Sur l'estimation des caractères obtenus dans la procédure statistique de reconnaissance (en russe)», Techicheskaya Kibernetica, vol. 3, 1969.
mais pour autant que je sache, ils ne couvrent que la validation croisée avec sortie (mon russe technique n'est pas tout ce qu'il pourrait être; o).
la source
Réponses:
Un document qui mérite d'être consulté est
Stone M. Choix de validation croisée et évaluation des prédictions statistiques. J. Royal Stat. Soc., 36 (2), 111–147, 1974.
J'ai vu des références à
Mosteller F. et Tukey JW Analyse des données, y compris les statistiques. Dans Handbook of Social Psychology. Addison-Wesley, Reading, MA, 1968.
comme une première description claire de la validation croisée fold, mais je n'ai pas ce manuscrit.k
Le papier de 1931
Larson S. Le rétrécissement du coefficient de corrélation multiple. J. Educat. Psychol., 22: 45-55, 1931.
est cité, par exemple par Stone, comme un exemple précoce où un ensemble de validation sélectionné au hasard est mis de côté pour une évaluation ultérieure du modèle.
la source