Comment calculer l'erreur de prévision (intervalles de confiance) pour les périodes en cours?

14

J'ai souvent besoin de prévoir les périodes futures dans des séries mensuelles de données.

Des formules sont disponibles pour calculer l'intervalle de confiance à alpha pour la prochaine période de la série chronologique, mais cela ne comprend jamais comment traiter la deuxième période, la troisième, etc.

J'imagine visuellement que si une prévision était représentée graphiquement avec des intervalles de confiance supérieurs et inférieurs, ces intervalles devraient généralement augmenter ou diminuer de façon exponentielle par rapport à la prévision moyenne, car l'incertitude est une force cumulative.

Disons que j'ai eu une vente unitaire d'avril = 10 mai = 8 juin = 11 juillet = 13 et aucun autre contexte tel que la saisonnalité ou les données démographiques

Nous devons prévoir (quoique aveuglément) août, septembre, octobre.

Quelle méthode utiliseriez-vous? et plus important encore ici, comment allez-vous mesurer la confiance pour septembre et octobre?

Désolé que cela puisse être une question simple pour certains experts - J'ai creusé loin pour une réponse claire, et je suis sûr que c'est quelque chose que tous les amateurs comme moi aimeraient comprendre.

pseudo
la source

Réponses:

8

Il y a tellement d'aspects étroits qui calculent les intervalles de prédiction : le processus de génération de données et le modèle utilisé pour décrire ce processus (modèle de série chronologique, modèle de régression), sont vos données stationnaires (pour ce type, votre conclusion est fausse car les données stationnaires n'ont pas tendance à s'exécuter) loin de sa valeur moyenne) ou explosif (pour un processus intégré, vous verrez quelque chose que vous avez décrit). Je pense qu'un excellent examen par Chris Chatfield concernant les intervalles de prédiction répondra à la plupart de vos questions.

Concernant les ventes unitaires:

  • comme vous avez un intervalle de prévision court, vous pouvez essayer de prévoir par lissage exponentiel (dans R, c'est la ets()fonction deforecast )
  • une autre option serait de le modéliser comme le processus ARIMA (la même bibliothèque a auto.arima() )
  • en micro-économétrie, cependant, les modèles de régression sont préférables aux modèles a-théoriques, mais à court terme, ils ne battent pas nécessairement les deux premiers

Les deux cas ont des formules pour calculer les intervalles de prédiction et sont discutés dans la revue susmentionnée (généralement la normalité des résidus est supposée, mais ce n'est pas une hypothèse cruciale).

Dmitrij Celov
la source
@Nick, Si vous avez des difficultés à lire l'article, vous pouvez demander de l'aide.
Dmitrij Celov
+1 pour le package "prévisions". Même si vous avez votre propre modèle de lissage exponentiel ou modèle arima, il inclut des fonctions de prédiction pour les deux classes de modèles qui incluent des intervalles de confiance.
Zach
@Dmitrij Merci. Après votre réponse et votre apprentissage de R, je n'ai commencé à en savoir plus et à connaître les fonctions maintenant. Cela ouvre bien plus qu'excellent.
Nick