Après avoir lu l' un des "Conseils de recherche" de RJ Hyndman sur la validation croisée et les séries chronologiques, je suis revenu à une vieille question que je vais essayer de formuler ici. L'idée est que dans les problèmes de classification ou de régression, l'ordre des données n'est pas important et, par conséquent, la validation croisée à k peut être utilisée. En revanche, dans les séries chronologiques, la mise en ordre des données est évidemment d'une grande importance.
Cependant, lors de l' utilisation d' un modèle d' apprentissage machine séries chronologiques prévisions, une stratégie commune consiste à remodeler la série en un ensemble de "vecteurs d'entrée-sortie" , qui, pendant un temps t , ont la forme ( y t - n + 1 , . . . , Y t - 1 , y t , y t + 1 ) .
Maintenant, une fois ce remodelage effectué, peut-on considérer que l'ensemble résultant de "vecteurs d'entrée-sortie" n'a pas besoin d'être ordonné? Si nous utilisons, par exemple, un réseau neuronal à action directe avec n entrées pour «apprendre» ces données, nous arriverions aux mêmes résultats, peu importe l'ordre dans lequel nous montrons les vecteurs au modèle. Et par conséquent, pourrions-nous utiliser la validation croisée k-fold de manière standard, sans avoir besoin de réajuster le modèle à chaque fois?