J'ai un ensemble de données de séries chronologiques multivariées comprenant des variables biologiques et environnementales en interaction (plus éventuellement des variables exogènes). Outre la saisonnalité, il n'y a pas de tendance claire à long terme dans les données. Mon but est de voir quelles variables sont liées les unes aux autres. La prévision n'est pas vraiment recherchée.
Étant nouveau dans l'analyse de séries chronologiques, j'ai lu plusieurs références. Pour autant que je sache, le modèle vectoriel autorégressif (VAR) serait approprié, mais je ne me sens pas à l'aise avec la saisonnalité et la plupart des exemples que j'ai trouvés concernaient le domaine économique (comme souvent avec l'analyse de séries chronologiques…) sans saisonnalité.
Que dois-je faire avec mes données saisonnières? Je considérais les désaisonnalisation - par exemple dans R, j'utiliser decompose
et ensuite utiliser les $trend + $rand
valeurs pour obtenir un signal qui apparaît assez stationnaire (comme jugé par acf
). Les résultats du modèle VAR me prêtent à confusion (un modèle à 1 décalage est sélectionné alors que j'en aurais attendu intuitivement plus, et seuls les coefficients d'autorégression - et non de régression avec d'autres variables retardées - sont significatifs). Suis-je en train de faire quelque chose de mal, ou devrais-je conclure que mes variables ne sont pas (linéairement) liées / mon modèle n'est pas le bon (question subsidiaire: existe-t-il un équivalent non linéaire de VAR?).
[Alternativement, j'ai lu que je pourrais probablement utiliser des variables saisonnières factices, bien que je ne puisse pas comprendre exactement comment l'implémenter].
Des suggestions étape par étape seraient très appréciées, car les détails pour les utilisateurs expérimentés pourraient en fait m'informer (et les extraits de code R ou les liens vers des exemples concrets sont les bienvenus, bien sûr).
Réponses:
Je sais que cette question est à peu près ancienne mais elle est restée sans réponse. Peut-être que la question principale n'est pas de savoir comment supprimer le cycle saisonnier dans les données, mais il en fait partie, alors je vais essayer: pour supprimer la saisonnalité d'un ensemble de données, il existe plusieurs méthodes, des simples moyennes mensuelles agrégées à ajuster une fonction sinusoïdale (ou une autre harmonique appropriée) avec des méthodes d'ajustement non linéaires comme Nelder-Mead.
Le moyen le plus simple consiste à faire la moyenne des données appartenant à tous les Januaries, à tous les Februaries, etc., c'est-à-dire que vous créez un cycle annuel composé, que vous pouvez ensuite soustraire de vos données
la source