Autocorrélation résiduelle versus variable dépendante décalée

13

Lors de la modélisation de séries chronologiques, on a la possibilité de (1) modéliser la structure corrélationnelle des termes d'erreur comme par exemple un processus AR (1) (2) inclure la variable dépendante retardée comme variable explicative (sur le côté droit)

Je comprends que ce sont parfois des raisons substantielles d'aller (2).

Cependant, quelles sont les raisons méthodologiques de faire (1) ou (2) ou même les deux?

majom
la source

Réponses:

7

Il existe de nombreuses approches pour modéliser des données de séries chronologiques intégrées ou presque intégrées. De nombreux modèles font des hypothèses plus spécifiques que les modèles plus généraux et peuvent donc être considérés comme des cas particuliers. de Boef et Keele (2008) font un bon travail en énonçant divers modèles et en indiquant où ils se rapportent. Le modèle de correction d'erreur généralisé à une seule équation (GECM; Banerjee, 1993) est un bon modèle car il est (a) agnostique par rapport à la stationnarité / non-stationnarité des variables indépendantes, (b) peut accueillir plusieurs variables dépendantes, des effets aléatoires , plusieurs retards, etc., et (c) a des propriétés d'estimation plus stables que les modèles de correction d'erreur à deux degrés (de Boef, 2001).

Bien sûr, les détails d'un choix de modélisation donné seront particuliers aux besoins des chercheurs, de sorte que votre kilométrage peut varier.

Exemple simple de GECM:

Δyti=β0+βc(yt1xt1)+βΔxΔxt+βxxt1+ε

Où:
est l'opérateur de changement; les effets instantanés à court terme de x sur Δ y sont donnés par β Δ x ; les effets retardés à court terme de x sur Δ y sont donnés par β x - β c - β Δ x ; et les effets d'équilibre à long terme de x sur Δ y sont donnés par ( β c - β x ) / β c .Δ
xΔyβΔx
xΔyβxβcβΔx
xΔy(βcβx)/βc


Les références

Banerjee, A., Dolado, JJ, Galbraith, JW et Hendry, DF (1993). Co-intégration, correction d'erreurs et analyse économétrique de données non stationnaires . Oxford University Press, États-Unis.

De Boef, S. (2001). Modélisation des relations d'équilibre: modèles de correction d'erreur avec des données fortement autorégressives. Analyse politique , 9 (1): 78–94.

De Boef, S. et Keele, L. (2008). Prendre le temps au sérieux. American Journal of Political Science , 52 (1): 184–200.

Alexis
la source
Le modèle que vous spécifiez peut être reformulé comme un cas particulier d'une fonction de transfert, tout comme un modèle de lissage exponentiel est un cas particulier d'un modèle ARIMA. Veuillez reformuler votre modèle en tant que fonction de régression / transfert dynamique.
IrishStat
pourquoi pas ? Si vous contraignez / spécifiez une fonction de transfert à un formulaire particulier, vous obtiendrez l'ECM.
IrishStat
2
@Irish Si cette réponse est correcte, alors Alexis ne devrait pas se sentir obligé de changer l'explication ou de la traduire sous une forme particulière. Vous avez souvent mentionné les «fonctions de transfert» et je pense avoir lu tous vos (centaines) de messages qui s'y réfèrent, mais je ne me souviens pas avoir lu la description de ce qu'ils sont réellement. Vous pourriez alors envisager de publier votre propre réponse dans laquelle vous expliquez les fonctions de transfert et montrez comment le modèle d'Alexis peut être reformulé en ces termes.
whuber
βxx
................
IrishStat
5

Cela se résume à la probabilité maximale par rapport aux méthodes des moments et à l'efficacité des échantillons finis par rapport à l'opportunité du calcul.

ρσ2

L'approche de régression revient à la méthode d'estimation de Yule-Walker, qui est la méthode des moments. Pour un échantillon fini, il n'est pas aussi efficace que ML, mais dans ce cas (c'est-à-dire un modèle AR), il a une efficacité relative asymptotique de 1,0 (c'est-à-dire qu'avec suffisamment de données, il devrait donner des réponses presque aussi bonnes que ML). De plus, en tant que méthode linéaire, elle est efficace sur le plan des calculs et évite tout problème de convergence du ML.

J'ai glané la majeure partie de cela des souvenirs sombres d'une classe de séries chronologiques et des notes de conférence de Peter Bartlett pour Introduction à la série chronologique , conférence 12 en particulier.

Notez que la sagesse ci-dessus concerne les modèles de séries chronologiques traditionnels, c'est-à-dire où il n'y a pas d'autres variables à l'étude. Pour les modèles de régression de séries chronologiques, où il existe diverses variables indépendantes (c.-à-d. Explicatives), voir ces autres références:

  • Achen, CH (2001). Pourquoi les variables dépendantes décalées peuvent supprimer le pouvoir explicatif d'autres variables indépendantes. Réunion annuelle de la section de la méthodologie politique de l'American Politcal Science Association, 1–42. PDF
  • Nelson, CR et Kang, H. (1984). Pièges dans l'utilisation du temps comme variable explicative dans la régression. Journal of Business & Economic Statistics, 2 (1), 73–82. doi: 10.2307 / 1391356
  • Keele, L. et Kelly, NJ (2006). Modèles dynamiques pour les théories dynamiques: les tenants et aboutissants des variables dépendantes décalées. Analyse politique, 14 (2), 186-205. PDF

(Merci à Jake Westfall pour le dernier).

Le plat à emporter semble être «cela dépend».

Thomas Nichols
la source
2

YX

Après une brève recherche sur le Web, http://springschool.politics.ox.ac.uk/archive/2008/OxfordECM.pdf a expliqué comment un ECM était un cas particulier d'un ADL (Autoregressive Distributed Lag Model également connu sous le nom de PDL) . Un modèle ADL / PDL est un cas particulier d'une fonction de transfert. Ce matériau de la référence ci-dessus montre l'équivalence d'un ADL et d'un ECM. Notez que les fonctions de transfert sont plus générales que les modèles ADL car elles permettent une structure de désintégration explicite.

entrez la description de l'image ici

Mon point est que les puissantes fonctionnalités d'identification de modèle disponibles avec les fonctions de transfert doivent être utilisées plutôt que de supposer un modèle car elles correspondent au désir d'avoir des explications simples telles que Short Run / Long Run etc. Le modèle / l'approche de la fonction de transfert permet la robustification en permettant la l'identification d'une composante ARIMA arbitraire et la détection de violations gaussiennes telles que les impulsions / les changements de niveau / les impulsions saisonnières (variables factices saisonnières) et les tendances temporelles locales ainsi que les augmentations de la variance / des changements de paramètres.

Je serais intéressé à voir des exemples d'un ECM qui n'étaient pas fonctionnellement équivalents à un modèle ADL et ne pouvaient pas être refondus en tant que fonction de transfert.

entrez la description de l'image ici est un extrait De Boef and Keele (diapo 89)

IrishStat
la source