Comprendre le décalage k dans le test Dickey Fuller augmenté de R

15

J'ai joué avec des tests de racine unitaire en R et je ne sais pas trop quoi faire du paramètre k lag. J'ai utilisé le test Dickey Fuller augmenté et le test Philipps Perron du package tseries . Évidemment, le paramètre par défaut (pour le ) ne dépend que de la longueur de la série. Si je choisis différentes valeurs k, j'obtiens des résultats assez différents par rapport à. rejetant le null:kadf.testk

Dickey-Fuller = -3.9828, Lag order = 4, p-value = 0.01272
alternative hypothesis: stationary 
# 103^(1/3)=k=4 


Dickey-Fuller = -2.7776, Lag order = 0, p-value = 0.2543
alternative hypothesis: stationary
# k=0

Dickey-Fuller = -2.5365, Lag order = 6, p-value = 0.3542
alternative hypothesis: stationary
# k=6

plus le résultat du test PP:

Dickey-Fuller Z(alpha) = -18.1799, Truncation lag parameter = 4, p-value = 0.08954
alternative hypothesis: stationary 

k

Des indices?

hans0l0
la source
3
ce livre devrait répondre à toutes vos questions.
mpiktas
1
Merci! J'adore la série Springer useR, mais je ne la connaissais pas ...
hans0l0
hmm, iiuc teste seulement si phi = 1, pas si phi> 1. Mais la sortie R dit toujours que l'alternative est: la stationnarité. Alors, vérifient-ils aussi phi> 1? De toute évidence, cela ne serait pas non plus stationnaire.
hans0l0

Réponses:

5

Cela fait un moment que je n'ai pas regardé les tests ADF, mais je me souviens d'au moins deux versions du test adf.

http://www.stat.ucl.ac.be/ISdidactique/Rhelp/library/tseries/html/adf.test.html

http://cran.r-project.org/web/packages/fUnitRoots/

Le package fUnitRoots a une fonction appelée adfTest (). Je pense que le problème "tendance" est traité différemment dans ces packages.

Modifier ------ À partir de la page 14 du lien suivant, il y avait 4 versions (uroot arrêtées) du test adf:

http://math.uncc.edu/~zcai/FinTS.pdf

Un lien de plus. Lisez la section 6.3 du lien suivant. Il fait un travail bien meilleur que je ne pourrais expliquer le terme de décalage:

http://www.yats.com/doc/cointegration-en.html

De plus, je serais prudent avec n'importe quel modèle saisonnier. À moins que vous ne soyez sûr qu'il y ait une certaine saisonnalité, j'éviterais d'utiliser des termes saisonniers. Pourquoi? Tout peut être décomposé en termes saisonniers, même s'il ne l'est pas. Voici deux exemples:

#First example: White noise
x <- rnorm(200)

#Use stl() to separate the trend and seasonal term
x.ts <- ts(x, freq=4) 
x.stl <- stl(x.ts, s.window = "periodic")
plot(x.stl)

#Use decompose() to separate the trend and seasonal term
x.dec <- decompose(x.ts)
plot(x.dec)

#===========================================

#Second example, MA process
x1 <- cumsum(x)

#Use stl() to separate the trend and seasonal term
x1.ts <- ts(x1, freq=4)
x1.stl <- stl(x1.ts, s.window = "periodic")
plot(x1.stl)

#Use decompose() to separate the trend and seasonal term
x1.dec <- decompose(x1.ts)
plot(x1.dec)

Le graphique ci-dessous est tiré de l'instruction ci-dessus (x.stl). stl () a trouvé un petit terme saisonnier dans le bruit blanc. Vous pourriez dire que ce terme est si petit que ce n'est vraiment pas un problème. Le problème est que, dans les données réelles, vous ne savez pas si ce terme est un problème ou non. Dans l'exemple ci-dessous, notez que la série de données de tendance comporte des segments où elle ressemble à une version filtrée des données brutes et d'autres segments où elle peut être considérée comme sensiblement différente des données brutes.

entrez la description de l'image ici

bill_080
la source
1

Le paramètre k est un ensemble de décalages ajoutés pour traiter la corrélation série. Le A dans l'ADF signifie que le test est augmenté par l'ajout de retards. La sélection du nombre de retards dans le chargeur automatique de documents peut se faire de différentes manières. Une manière courante consiste à commencer avec un grand nombre de retards sélectionnés a priori et à réduire le nombre de retards séquentiellement jusqu'à ce que le plus long retard soit statistiquement significatif.

Vous pouvez tester la corrélation en série dans les résidus après avoir appliqué les décalages dans l'ADF.

RAH
la source