Quelle est la meilleure façon de diviser les données de séries chronologiques en ensembles train / test / validation, où l'ensemble de validation serait utilisé pour le réglage d'hyperparamètre?
Nous avons 3 ans de données de vente quotidiennes, et notre plan est d'utiliser 2015-2016 comme données de formation, puis échantillonner au hasard 10 semaines à partir des données 2017 à utiliser comme ensemble de validation, et 10 semaines supplémentaires à partir des données 2017 pour l'ensemble de test. Nous ferons ensuite une marche en avant pour chacun des jours de l'ensemble de test et de validation.