Je ne connais pas très bien l'analyse des données de séries chronologiques. Cependant, j'ai ce que je pense être une tâche de prédiction simple à résoudre.
J'ai environ cinq ans de données issues d'un processus de génération commun. Chaque année représente une fonction à augmentation monotone avec une composante non linéaire. J'ai des comptes pour chaque semaine sur un cycle de 40 semaines pour chaque année. Le processus démarre, la fonction commence à zéro, augmente assez rapidement sur la première moitié de la fonction, ralentit sur la seconde moitié avant de se stabiliser au cours des cinq dernières semaines. Le processus est cohérent sur plusieurs années avec de petites différences de taux de variation et de volume entre les segments d'une année à l'autre.
Où égal au compte au temps x.
Le but est de prendre à t x (ou mieux de t 0 à t x , ou la pente jusqu'à ce point) et de prédire le N à t 40 . Par exemple, si N t 10 est 5000, quelle est la valeur attendue de N t 40 pour cette année. La question est donc de savoir comment modéliser ces données? C'est assez facile à résumer et à visualiser. Mais j'aimerais un modèle pour faciliter les prédictions et incorporer une mesure d'erreur.
la source
Réponses:
Comme l'a suggéré Andy W, l'approche la plus simple consiste probablement à utiliser un modèle de séries chronologiques univariées saisonnières. Si vous utilisez R, essayez l'un
auto.arima()
ou l' autreets()
du package de prévisions .L'un ou l'autre devrait fonctionner correctement, mais une méthode de série chronologique générale n'utilise pas toutes les informations fournies. En particulier, il semble que vous connaissiez la forme de la courbe chaque année, il serait donc préférable d'utiliser ces informations en modélisant les données de chaque année en conséquence. Ce qui suit est une suggestion qui essaie d'incorporer ces informations.
la source
Ce que vous demandez, c'est essentiellement ce que fait la modélisation Box Jenkins ARIMA (vos cycles annuels seraient appelés composants saisonniers). Outre la recherche de documents par vous-même, je suggère
Analyse de séries chronologiques appliquées pour les sciences sociales 1980 par R McCleary; RA Hay; EE Meidinger; D McDowall
Bien que je puisse penser à des raisons raisonnables pour lesquelles vous voulez prévoir plus loin dans le futur (et donc évaluer l'erreur en le faisant), c'est souvent très difficile dans la pratique. Si vous avez des composantes saisonnières très fortes, ce sera plus faisable. Sinon, vos estimations atteindront probablement un équilibre dans relativement peu de périodes futures.
Si vous prévoyez d'utiliser R pour s'adapter à vos modèles, vous devriez probablement consulter le site Web de Rob Hyndman (j'espère qu'il vous donnera de meilleurs conseils que moi!)
la source
vous avez 5 ans de données et 40 observations par an. Pourquoi ne les affichez-vous pas sur le Web et ne nous permettez pas de répondre à cette question au sol zéro plutôt que de philosopher à 500 miles de haut. J'attends avec impatience les chiffres. Nous avons vu des données comme celle-ci, par exemple le nombre de clients qui échangent leur semaine de partage de temps sur une base hebdomadaire. La série commence chaque année à zéro et s'accumule jusqu'à une valeur limite.
la source