J'ai joué avec des tests de racine unitaire en R et je ne sais pas trop quoi faire du paramètre k lag. J'ai utilisé le test Dickey Fuller augmenté et le test Philipps Perron du package tseries . Évidemment, le paramètre par défaut (pour le ) ne dépend que de la longueur de la série. Si je choisis différentes valeurs k, j'obtiens des résultats assez différents par rapport à. rejetant le null:adf.test
Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary
# 103^(1/3)=k=4
Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0
Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6
plus le résultat du test PP:
Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary
Des indices?
r
time-series
trend
hans0l0
la source
la source
Réponses:
Cela fait un moment que je n'ai pas regardé les tests ADF, mais je me souviens d'au moins deux versions du test adf.
http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html
http://cran.r-project.org/web/packages/fUnitRoots/
Le package fUnitRoots a une fonction appelée adfTest (). Je pense que le problème "tendance" est traité différemment dans ces packages.
Modifier ------ À partir de la page 14 du lien suivant, il y avait 4 versions (uroot arrêtées) du test adf:
http://math.uncc.edu/~zcai/FinTS.pdf
Un lien de plus. Lisez la section 6.3 du lien suivant. Il fait un travail bien meilleur que je ne pourrais expliquer le terme de décalage:
http://www.yats.com/doc/cointegration-en.html
De plus, je serais prudent avec n'importe quel modèle saisonnier. À moins que vous ne soyez sûr qu'il y ait une certaine saisonnalité, j'éviterais d'utiliser des termes saisonniers. Pourquoi? Tout peut être décomposé en termes saisonniers, même s'il ne l'est pas. Voici deux exemples:
Le graphique ci-dessous est tiré de l'instruction ci-dessus (x.stl). stl () a trouvé un petit terme saisonnier dans le bruit blanc. Vous pourriez dire que ce terme est si petit que ce n'est vraiment pas un problème. Le problème est que, dans les données réelles, vous ne savez pas si ce terme est un problème ou non. Dans l'exemple ci-dessous, notez que la série de données de tendance comporte des segments où elle ressemble à une version filtrée des données brutes et d'autres segments où elle peut être considérée comme sensiblement différente des données brutes.
la source
Le paramètre k est un ensemble de décalages ajoutés pour traiter la corrélation série. Le A dans l'ADF signifie que le test est augmenté par l'ajout de retards. La sélection du nombre de retards dans le chargeur automatique de documents peut se faire de différentes manières. Une manière courante consiste à commencer avec un grand nombre de retards sélectionnés a priori et à réduire le nombre de retards séquentiellement jusqu'à ce que le plus long retard soit statistiquement significatif.
Vous pouvez tester la corrélation en série dans les résidus après avoir appliqué les décalages dans l'ADF.
la source