Quel est le lien entre ARMA / ARIMA et la modélisation à effets mixtes?

14

Dans l'analyse des données de panel, j'ai utilisé des modèles à plusieurs niveaux avec des effets aléatoires / mixtes pour traiter les problèmes d'auto-corrélation (c.-à-d., Les observations sont regroupées au sein des individus au fil du temps) avec d'autres paramètres ajoutés pour s'adapter à certaines spécifications de temps et de chocs d'intérêt . ARMA / ARIMA semblent conçus pour résoudre des problèmes similaires.

Les ressources que j'ai trouvées en ligne traitent des séries chronologiques (ARMA / ARIMA) ou des modèles à effets mixtes, mais au-delà de s'appuyer sur la régression, je ne comprends pas la relation entre les deux. Peut-on vouloir utiliser ARMA / ARIMA à partir d'un modèle à plusieurs niveaux? Y a-t-il un sens dans lequel les deux sont équivalents ou redondants?

Des réponses ou des pointeurs vers des ressources qui en discutent seraient formidables.

Benjamin Mako Hill
la source

Réponses:

11

Je pense que la façon la plus simple de le voir est de noter que l'ARMA et les modèles similaires sont conçus pour faire des choses différentes des modèles à plusieurs niveaux et utiliser des données différentes.

L'analyse des séries chronologiques comporte généralement de longues séries chronologiques (éventuellement des centaines voire des milliers de points temporels) et l'objectif principal est d'examiner comment une seule variable change au fil du temps. Il existe des méthodes sophistiquées pour traiter de nombreux problèmes - pas seulement l'autocorrélation, mais la saisonnalité et d'autres changements périodiques, etc.

Les modèles à plusieurs niveaux sont des extensions de la régression. Ils ont généralement relativement peu de points dans le temps (bien qu'ils puissent en avoir plusieurs) et l'objectif principal est d'examiner la relation entre une variable dépendante et plusieurs variables indépendantes. Ces modèles ne sont pas aussi efficaces pour gérer les relations complexes entre une variable et l'heure, en partie parce qu'ils ont généralement moins de points de temps (il est difficile de considérer la saisonnalité si vous n'avez pas plusieurs données pour chaque saison).

Peter Flom - Réintégrer Monica
la source
1
: Peter Très beau résumé. J'ajouterais seulement que les données de séries chronologiques ne sont généralement pas "longues" lorsqu'il s'agit de données hebdomadaires / mensuelles / annuelles, MAIS peuvent être longues lorsqu'il s'agit de données quotidiennes / horaires / secondes.
IrishStat
3
Votre explication est assez bonne, dans la pratique, bien que j'ajouterais une légère mise en garde. Les modèles ARIMA peuvent être mis en œuvre en tant que modèles d'espace d'état (les R le arimafont sous le capot), également appelés modèles linéaires dynamiques (DLM). Les DLM sont également des extensions de la régression (d'une manière différente des effets mixtes), donc je suppose qu'il existe une relation profonde entre ARIMA et les modèles à effets mixtes. Cela ne change pas les différences de pratique , que vous résumez bien.
Wayne
1
t-1
Benjamin: Toute l'idée de la statistique est d'IDENTIFIER LA STRUCTURE et non de l'assumer.
IrishStat
Je pense qu'une réponse complète pourrait également mentionner la différence entre les séries chronologiques et les données du panel. Si je comprends bien, ARIMA et similaires sont principalement utilisés pour les données où chaque observation est de la même variable dans le temps. Dans le modèle de changement à plusieurs niveaux, nous nous concentrons généralement sur les données de panel et nous modélisons une variable mesurée à travers une gamme d'individus, de groupes, de pays, etc., au fil du temps. Droite?
Benjamin Mako Hill,
7

ARMA / ARIMA sont des modèles univariés qui optimisent la façon d'utiliser le passé d'une seule série pour prédire cette seule série. On peut augmenter ces modèles avec des variables d'intervention identifiées empiriquement telles que les impulsions, les changements de niveau, les impulsions saisonnières et les tendances de l'heure locale MAIS elles sont toujours fondamentalement non causales car aucune série d'entrée suggérée par l'utilisateur n'est en place. L'extension multivariée de ces modèles est appelée XARMAX ou plus généralement des modèles de fonction de transfert qui utilisent des structures PDL / ADL sur les entrées et emploient toute structure ARMA / ARIMA nécessaire sur le reste. Ces modèles peuvent également être renforcés en incorporant des données déterministes empiriquement identifiables. Ainsi, ces deux modèles peuvent être considérés comme des applications aux données longitudinales (mesures répétées). Maintenant, l'article Wikipedia sur les modèles à plusieurs niveaux se réfère à leur application aux séries chronologiques / données longitudinales en supposant certaines structures primitives / triviales, c'est-à-dire non analytiques comme "Les modèles les plus simples supposent que l'effet du temps est linéaire. Des modèles polynomiaux peuvent être spécifiés pour permettre des effets quadratiques ou cubiques du temps" .

On peut étendre le modèle de fonction de transfert pour couvrir plusieurs groupes, évoluant ainsi vers l'analyse de séries chronologiques transversales regroupées où la structure appropriée (retards / pistes) peut être utilisée conjointement avec la structure ARIMA pour former à la fois des modèles locaux et un modèle global.

IrishStat
la source
Les modèles à plusieurs niveaux peuvent également utiliser une spécification générale pour le temps qui ajoute des variables muettes pour chaque temps qui captureront l'effet moyen pour cette période.
Benjamin Mako Hill
1
: Benjamin Le problème avec rhat est que vous supposez que la saisonnalité est déterministe et pour couronner le tout que les coefficients saisonniers sont invariants dans le temps par rapport à une impulsion saisonnière l'un des nuls ISI-1 qui n'a eu aucun effet pour la première fois k périodes mais l'a fait après. Une autre structure saisonnière tout aussi possible est la composante saisonnière ARIMA qui utilise une réponse adaptative aux saisons précédentes par rapport à votre réponse FIXE suggérée.
IrishStat