J'ai tracé le code suivant avec la fonction stl (décomposition saisonnière des séries chronologiques par Loess):
plot(stl(ts(rnorm(144), frequency=12), s.window="periodic"))
Il montre une variation saisonnière importante avec des données aléatoires mises dans le code ci-dessus (fonction rnorm). Une variation importante est observée à chaque exécution, bien que le modèle soit différent. Deux de ces modèles sont illustrés ci-dessous:
Comment peut-on s'appuyer sur la fonction stl sur certaines données lorsqu'elle montre une variation saisonnière. Cette variation saisonnière doit-elle être considérée à la lumière d'autres paramètres? Merci pour votre perspicacité.
Le code est tiré de cette page: Est-ce une méthode appropriée pour tester les effets saisonniers dans les données sur le nombre de suicides?
Réponses:
La décomposition de Loess a pour but de lisser la série en appliquant des moyennes aux données afin qu'elles s'effondrent en composantes, par exemple la tendance ou saisonnières, qui sont intéressantes pour l'analyse des données. Mais cette méthodologie n'est pas destinée à faire un test formel de la présence de saisonnalité .
Bien que dans votre exemple
stl
renvoie un modèle lissé de périodicité saisonnière, ce modèle n'est pas pertinent pour expliquer la dynamique de la série. Pour voir cela, nous pouvons comparer la variance de chaque composante par rapport à la variance de la série d'origine.Nous pouvons voir que c'est le reste qui explique la majeure partie de la variance des données (comme on pourrait s'y attendre pour un processus de bruit blanc).
Si nous prenons une série avec saisonnalité, la variance relative de la composante saisonnière est beaucoup plus pertinente (bien que nous n'ayons pas de méthode simple pour la tester car le loess n'est pas paramétrique).
Les variances relatives indiquent que la saisonnalité est la principale composante expliquant la dynamique de la série.
Un regard imprudent sur l'intrigue
stl
peut être trompeur. Le beau modèle renvoyé parstl
peut nous faire penser qu'un modèle saisonnier pertinent peut être identifié dans les données, mais un examen plus approfondi peut révéler que ce n'est pas réellement le cas. Si le but est de décider de la présence d'une saisonnalité, la décomposition du loess peut être utile comme vue préliminaire, mais elle doit être complétée par d'autres outils.la source
Dans la même veine, j'ai vu l'utilisation des modèles de Fourier à des données non saisonnières, forçant une structure saisonnière dans les valeurs d'ajustement et de prévision, provoquant un résultat similaire (halètement!). L'adaptation d'un modèle présumé donne à l'utilisateur ce qu'il impose / présume, ce qui n'est pas toujours ce que de bonnes analyses suggèrent / fournissent.
la source
stl()
n'est pas basé sur des idées de Fourier. Bien que je n'aie encore vu personne prôner une analyse "insensée", notez que toute famille modèle adaptée pourrait être considérée comme imposée ou présumée. La question est de savoir dans quelle mesure une procédure offre aux utilisateurs la possibilité de réaliser si et comment elle fonctionne mal pour un ensemble de données particulier.