Je travaille sur l'ensemble des données electricity
disponibles dans le package R TSA
. Mon objectif est de savoir si un arima
modèle sera approprié pour ces données et éventuellement de l'adapter. J'ai donc procédé comme suit:
1er: Tracer la série chronologique qui a résulté si le graphique suivant:
2e: Je voulais prendre un journal de electricity
pour stabiliser la variance et ensuite différencié la série comme il convient, mais juste avant de le faire, j'ai testé la stationnarité sur le ensemble de données d'origine à l'aide du adf
test (Augmented Dickey Fuller) et, de façon surprenante, il a donné les résultats suivants:
Code et résultats:
adf.test(electricity)
Augmented Dickey-Fuller Test
data: electricity
Dickey-Fuller = -9.6336, Lag order = 7, p-value = 0.01
alternative hypothesis: stationary
Warning message: In adf.test(electricity) : p-value smaller than printed p-value
Eh bien, selon la notion de série temporelle de mon débutant, je suppose que cela signifie que les données sont stationnaires (petite valeur de p, rejetons l'hypothèse nulle de non-stationnarité). Mais en regardant l'intrigue ts, je ne trouve aucun moyen que cela puisse être stationnaire. Quelqu'un a-t-il une explication valable à cela?
Réponses:
adf.test
la source
En supposant que "adf.test" provient vraiment du package "tseries" (directement ou indirectement), la raison en serait qu'il inclut automatiquement une tendance temporelle linéaire. Extrait du doc tseries (version 0.10-35): "L'équation de régression générale qui incorpore une constante et une tendance linéaire est utilisée [...]" Le résultat du test indique donc bien la stationnarité de la tendance (qui malgré le nom n'est pas stationnaire).
Je conviens également avec Pantera que les effets saisonniers pourraient fausser le résultat. La série pourrait en réalité être une tendance temporelle + saisonnières déterministes + processus de racine unitaire stochastique, mais le test ADF pourrait mal interpréter les fluctuations saisonnières comme des inversions stochastiques de la tendance déterministe, ce qui impliquerait des racines plus petites que l'unité. (D'un autre côté, étant donné que vous avez inclus suffisamment de décalages, cela devrait plutôt apparaître comme des racines unitaires (parasites) aux fréquences saisonnières, et non pas la fréquence zéro / à long terme que le test ADF examine. Dans tous les cas, étant donné la modèle saisonnier, il est préférable d'inclure les saisonniers.)
la source