Calcul de l'erreur de prévision avec validation croisée des séries chronologiques

13

J'ai un modèle de prévision pour une série chronologique et je veux calculer son erreur de prédiction hors échantillon. En ce moment, la stratégie que je suis en train de suivre est celle suggérée sur le blog de Rob Hyndman (près du bas de la page) qui va comme ceci (en supposant une série temporelle et un ensemble d'entraînement de tailley1,,yn )k

  1. Mettre en place le modèle aux données et laisser y t + k être les prévisions pour l'observation suivante.yt,,yt+k1y^t+k
  2. Calculer l'erreur PRÉVISIONS .et=y^t+kyt+k
  3. Répéter pour t=1,,nk
  4. Calculez l'erreur quadratique moyenne comme MSE=1n-kt=1n-ket2

my^t+k,,y^t+k+m-1et,1,,et,m

m

J'apprécierais soit une explication ici, soit des liens vers un endroit où je peux trouver des résultats théoriques sur les intervalles de confiance autour du MSE (ou d'autres mesures d'erreur).

Chris Taylor
la source

Réponses:

11

Il semble que vous pourriez être plus intéressé par l'estimation des erreurs en utilisant le bootstrap à entropie maximale , plutôt que la validation croisée. Cela vous permettra de générer plusieurs bootstraps de vos données, que vous pourrez ensuite diviser en autant de trains / ensembles de tests que vous le souhaitez pour calculer les intervalles de confiance pour vos prévisions.

Rob Hyndman a d'autres discussions sur la validation croisée des séries chronologiques sur son blog , où il met en œuvre plusieurs méthodes différentes de «roulement» et de prévision, mais il est principalement axé sur la mise en œuvre. J'ai également d' autres implémentations sur mon blog . L'approche la plus simple serait peut-être de faire la moyenne de vos erreurs sur toutes les fenêtres temporelles, et donc d'ignorer les corrélations potentielles des erreurs.

Pour autant que je sache, l'état théorique de la validation croisée des données de séries chronologiques est quelque peu en retard sur l'état théorique de la validation croisée générale. Intuitivement, je m'attends à ce que l'erreur augmente à mesure que l'horizon augmente, ce qui suggère que vous devriez vous attendre à des erreurs corrélées à travers différents horizons de prévision. Pourquoi est-ce que cela vous inquiète?

Zach
la source