Qui a inventé la validation croisée k-fold?

24

Je cherche une référence à l'article où la validation croisée k-fold a été introduite (plutôt qu'une simple bonne référence académique pour le sujet). Il est peut-être trop loin dans la nuit des temps pour identifier sans ambiguïté le tout premier article, de sorte que tous les premiers articles où l'idée a été utilisée seraient intéressants.

Les premiers que je connaisse sont

PA Lachenbruch et MR Mickey, «Estimation des taux d'erreur dans l'analyse discriminante», Technometrics, vol. 10, non. 1, p. 1–12, février 1968.

et

A. Luntz et V. Brailovsky, «Sur l'estimation des caractères obtenus dans la procédure statistique de reconnaissance (en russe)», Techicheskaya Kibernetica, vol. 3, 1969.

mais pour autant que je sache, ils ne couvrent que la validation croisée avec sortie (mon russe technique n'est pas tout ce qu'il pourrait être; o).

Dikran Marsupial
la source
1
Je suppose que vous connaissez la loi de Stigler ? (À interpréter un peu plus largement que comme indiqué.) :)
Cardinal
J'apprends quelque chose de nouveau tous les jours! Une référence rapide fera l'affaire si l'inventeur d'origine est inconnu. Je soupçonne que c'est une de ces choses qui a été inventée indépendamment plusieurs fois, mais l'histoire est intéressante.
Dikran Marsupial

Réponses:

12

Un document qui mérite d'être consulté est

Stone M. Choix de validation croisée et évaluation des prédictions statistiques. J. Royal Stat. Soc., 36 (2), 111–147, 1974.

J'ai vu des références à

Mosteller F. et Tukey JW Analyse des données, y compris les statistiques. Dans Handbook of Social Psychology. Addison-Wesley, Reading, MA, 1968.

comme une première description claire de la validation croisée fold, mais je n'ai pas ce manuscrit.k

Le papier de 1931

Larson S. Le rétrécissement du coefficient de corrélation multiple. J. Educat. Psychol., 22: 45-55, 1931.

est cité, par exemple par Stone, comme un exemple précoce où un ensemble de validation sélectionné au hasard est mis de côté pour une évaluation ultérieure du modèle.

NRH
la source
La référence à Mosteller et Tukey semble un bon début +1 (je suppose que c'est Tukey plutôt que la Turquie!; O)
Dikran Marsupial
@DikranMarsupial, Ha, excuses à Tukey. J'ai copié-collé la référence et je n'ai pas remarqué le nom mal orthographié. Oui, c'est définitivement Tukey.
NRH
1
Mosteller et Tukey: books.google.pl/…
liori