Séries chronologiques biologiques multivariées: VAR et saisonnalité

15

J'ai un ensemble de données de séries chronologiques multivariées comprenant des variables biologiques et environnementales en interaction (plus éventuellement des variables exogènes). Outre la saisonnalité, il n'y a pas de tendance claire à long terme dans les données. Mon but est de voir quelles variables sont liées les unes aux autres. La prévision n'est pas vraiment recherchée.

Étant nouveau dans l'analyse de séries chronologiques, j'ai lu plusieurs références. Pour autant que je sache, le modèle vectoriel autorégressif (VAR) serait approprié, mais je ne me sens pas à l'aise avec la saisonnalité et la plupart des exemples que j'ai trouvés concernaient le domaine économique (comme souvent avec l'analyse de séries chronologiques…) sans saisonnalité.

Que dois-je faire avec mes données saisonnières? Je considérais les désaisonnalisation - par exemple dans R, j'utiliser decomposeet ensuite utiliser les $trend + $randvaleurs pour obtenir un signal qui apparaît assez stationnaire (comme jugé par acf). Les résultats du modèle VAR me prêtent à confusion (un modèle à 1 décalage est sélectionné alors que j'en aurais attendu intuitivement plus, et seuls les coefficients d'autorégression - et non de régression avec d'autres variables retardées - sont significatifs). Suis-je en train de faire quelque chose de mal, ou devrais-je conclure que mes variables ne sont pas (linéairement) liées / mon modèle n'est pas le bon (question subsidiaire: existe-t-il un équivalent non linéaire de VAR?).

[Alternativement, j'ai lu que je pourrais probablement utiliser des variables saisonnières factices, bien que je ne puisse pas comprendre exactement comment l'implémenter].

Des suggestions étape par étape seraient très appréciées, car les détails pour les utilisateurs expérimentés pourraient en fait m'informer (et les extraits de code R ou les liens vers des exemples concrets sont les bienvenus, bien sûr).

ztl
la source
2
Tout dépend de la façon dont vous pensez de la saisonnalité. Ma lecture inégale de la littérature indique que les économistes considèrent souvent la saisonnalité comme une nuisance sans intérêt tandis que les spécialistes de l'environnement se sentent souvent beaucoup plus positifs à ce sujet. La méthode des variables muettes utilisée en économie repose souvent sur des données trimestrielles ou mensuelles et des effets des vacances (dans tous les sens du terme) parfois pointus; avec des données environnementales, vous pouvez parfois bien faire avec certains termes de Fourier (sinusoïdaux) et ne pas avoir besoin de mannequins.
Nick Cox
2
Merci, @Nick Cox. Les termes de Fourier ne semblent pas être une solution dans mon cas particulier, où les variables présentent un schéma saisonnier plus compliqué que les signaux sinusoïdaux (sauf si j'utilise plusieurs harmoniques, mais ce n'est pas tant le but ici). Et bien que la saisonnalité ne soit clairement pas un terme de nuisance sans intérêt dans mon cas, je cherchais plutôt quelque chose qui m'aiderait à expliquer la variabilité supplémentaire des données au-delà de la saisonnalité (c'est-à-dire la tendance à plus long terme) en fonction d'autres variables.
ztl
4
Qu'en est-il d'un modèle ARMA multivarié? Il est similaire à VAR, mais si je comprends bien, permet une interaction plus dynamique entre les variables. Quelqu'un d'autre pourrait confirmer / rejeter mes soupçons.
rbatt

Réponses:

1

Je sais que cette question est à peu près ancienne mais elle est restée sans réponse. Peut-être que la question principale n'est pas de savoir comment supprimer le cycle saisonnier dans les données, mais il en fait partie, alors je vais essayer: pour supprimer la saisonnalité d'un ensemble de données, il existe plusieurs méthodes, des simples moyennes mensuelles agrégées à ajuster une fonction sinusoïdale (ou une autre harmonique appropriée) avec des méthodes d'ajustement non linéaires comme Nelder-Mead.

Le moyen le plus simple consiste à faire la moyenne des données appartenant à tous les Januaries, à tous les Februaries, etc., c'est-à-dire que vous créez un cycle annuel composé, que vous pouvez ensuite soustraire de vos données

nukimov
la source