Régression avec une fréquence différente

10

J'essaie de faire une régression simple mais mes variables Y sont observées sur une fréquence mensuelle et les variables x sont observées sur une fréquence annuelle. J'apprécierai vraiment quelques conseils sur une approche appropriée qui peut être utilisée pour des régressions avec différentes fréquences.

Merci beaucoup

magnaJ
la source
Si vous concevez la relation comme causale, il peut être utile de réfléchir à la façon dont vous voyez exactement le X menant au Y - cela rendra alors souvent plus claire une stratégie potentielle. Comment votre chose annuelle mène-t-elle à un résultat sur votre chose mensuelle? Est-ce que X est un proxy pour autre chose, ou Y dépend-il vraiment de annual-X?
Glen_b -Reinstate Monica

Réponses:

6

Trois possibilités s'ensuivent. Selon la situation, n'importe qui pourrait convenir.

  1. Agrégation ou désagrégation de temps.

Il s'agit peut-être de l'approche la plus simple dans laquelle vous convertissez les données haute fréquence (mensuelles) en données annuelles en prenant, par exemple, des sommes, des moyennes ou des valeurs de fin de période. Les données de basse fréquence (annuelles) pourraient bien sûr être converties en données mensuelles en utilisant une technique d'interpolation; par exemple, en utilisant la procédure Chow-Lin. Il peut être utile de se référer au tempdisaggpackage pour cela: http://cran.r-project.org/web/packages/tempdisagg/index.html .

  1. Mi (xed) da (ta) s (amplification) (MIDAS).

Les régressions Midas, popularisées par Eric Ghysels, sont une deuxième option. Il y a deux idées principales ici. Le premier est l'alignement de fréquence. La seconde consiste à lutter contre la malédiction de la dimensionnalité en spécifiant un polynôme approprié. Le modèle MIDAS sans restriction est le plus simple de la classe des modèles et peut être estimé par les moindres carrés ordinaires. Plus de détails et comment implémenter ces modèles en Rutilisant le midasrpackage peuvent être trouvés ici: http://mpiktas.github.io/midasr/ . Pour MATLAB, reportez-vous à la page de Ghysels: http://www.unc.edu/~eghysels/ .

  1. Méthodes de filtrage de Kalman.

Il s'agit d'une approche de modélisation de l'espace d'état, qui implique de traiter les données à basse fréquence comme contenant des NA et de les remplir à l'aide d'un filtre de Kalman. C'est ma préférence personnelle, mais elle a la difficulté de spécifier le bon modèle d'espace d'état.

Pour un examen plus approfondi des avantages et des inconvénients de ces méthodes, reportez-vous à State Space Models and MIDAS Regressions de Jennie Bai, Eric Ghysels et Jonathan H. Wright (2013).

Graeme Walsh
la source
Il y a aussi une implémentation MiDAS en python: github.com/mikemull/midaspy
Rafael Valero