J'utilise R (3.1.1) et les modèles ARIMA pour les prévisions. Je voudrais savoir quel devrait être le paramètre "fréquence", qui est affecté dans la ts()
fonction , si je utilise des données de séries chronologiques qui sont:
- séparés par des minutes et s'étalent sur 180 jours (1440 minutes / jour)
- séparés par des secondes et s'étalent sur 180 jours (86 400 secondes / jour).
Si je me souviens bien la définition, une "fréquence" en ts dans R, est le nombre d'observations par "saison".
Question partie 1:
Quelle est la "saison" dans mon cas?
Si la saison est "jour", la "fréquence" des minutes = 1440 et 86 400 des secondes?
Question partie 2:
La "fréquence" pourrait-elle également dépendre de ce que j'essaie de réaliser / de prévoir? par exemple, dans mon cas, j'aimerais avoir des prévisions à très court terme. Une longueur d'avance de 10 minutes à chaque fois. Serait-il alors possible de considérer la saison comme une heure au lieu d'une journée? Dans ce cas, fréquence = 60 pour les minutes, fréquence = 3600 pour les secondes?
J'ai essayé par exemple d'utiliser la fréquence = 60 pour les données minute et j'ai obtenu de meilleurs résultats par rapport à la fréquence = 1440 (utilisé fourier
voir le lien ci-dessous par Hyndman)
http://robjhyndman.com/hyndsight/forecasting-weekly-data/
(La comparaison a été effectuée en utilisant MAPE pour mesurer la précision des prévisions)
Dans le cas où les résultats sont arbitraires complets et que la fréquence ne peut pas être modifiée. Quelle serait en fait l'interprétation de l'utilisation de freq = 60 sur mes données?
Je pense également qu'il convient de mentionner que mes données contiennent une saisonnalité à toutes les heures et toutes les deux heures (en observant les données brutes et la fonction d'autocorrélation)
la source