Je travaille depuis des mois sur les prévisions de charge à court terme et l'utilisation des données climatiques / météorologiques pour améliorer la précision. J'ai une formation en informatique et pour cette raison j'essaie de ne pas faire de grosses erreurs et des comparaisons injustes en travaillant avec des outils statistiques comme les modèles ARIMA. J'aimerais connaître votre opinion sur deux ou trois choses:
J'utilise les modèles (S) ARIMA et (S) ARIMAX pour étudier l'effet des données météorologiques sur les prévisions, pensez-vous qu'il serait nécessaire d'utiliser également des méthodes de lissage exponentiel?
Ayant une série chronologique de 300 échantillons quotidiens, je commence à partir des deux premières semaines et j'effectue une prévision à 5 jours à l'avance en utilisant des modèles construits avec la fonction auto.arima R (package de prévision). Ensuite, j'ajoute un autre échantillon à mon jeu de données et je calibre à nouveau les modèles et j'effectue encore 5 jours de prévisions et ainsi de suite jusqu'à la fin des données disponibles. Pensez-vous que cette façon de fonctionner est correcte?
Merci pour vos suggestions, bien que la cible de notre travail soit un article de revue d'ingénierie, j'aimerais faire un travail aussi rigoureux que possible d'un point de vue statistique.
la source
Réponses:
Je pense qu'il vaudrait également la peine d'explorer des modèles de lissage exponentiel. Les modèles de lissage exponentiel sont une classe de modèles fondamentalement différente des modèles ARIMA et peuvent donner des résultats différents sur vos données.
Cela ressemble à une approche valide et est très similaire à la méthode de validation croisée des séries chronologiques proposée par Rob Hyndman .
Je voudrais agréger l'erreur de validation croisée de chaque prévision (lissage exponentiel, ARIMA, ARMAX) puis utiliser l'erreur globale pour comparer les 3 méthodes.
Vous pouvez également envisager une "recherche dans la grille" pour les paramètres ARIMA, plutôt que d'utiliser auto.arima. Dans une recherche de grille, vous exploreriez chaque paramètre possible pour un modèle arima, puis sélectionnez les «meilleurs» en utilisant la précision des prévisions.
la source