Comment interpréter ces parcelles ACF et PACF

Vous trouverez ci-dessous des graphiques en acf et pacf d'une série de données mensuelles. Le deuxième tracé est acf avec ci.type = 'ma':

entrez la description de l'image ici

La persistance de valeurs élevées dans la parcelle acf représente probablement une tendance positive à long terme. La question est de savoir si cela représente une variation saisonnière?

J'ai essayé de voir différents sites sur ce sujet, mais je ne sais pas si ces parcelles présentent une saisonnalité.

Analyse des parcelles ACF et PACF

Aide à l'interprétation des tracés ACF et PACF

Aidez à comprendre l'image suivante d'ACF

Autocorrélation et interprétation d'autocorrélation partielle

Edit: voici le graphique du décalage jusqu'à 60:

entrez la description de l'image ici

Voici des tracés de diff (my_series):

entrez la description de l'image ici

Et jusqu'à un décalage de 60:

entrez la description de l'image ici

Modifier: Ces données proviennent de: Est-ce une méthode appropriée pour tester les effets saisonniers dans les données sur le nombre de suicides? Ici, les contributeurs n'ont pas pris en considération les intrigues acf et pacf de séries originales ou différenciées (cela ne doit donc pas être important). Seules les parcelles acf / pacf de résidus ont été mentionnées à quelques endroits.

time-series rnso
la source

Pouvez-vous ajouter quelque chose à propos de vos données (par exemple, un tracé de base)? Avez-vous essayé quelque chose comme ça stl()?

gung - Rétablir Monica

J'essaie de comprendre comment déterminer la saisonnalité des parcelles acf et pacf. Un examen de l'intrigue ou du stl de base est-il nécessaire pour cela? Ne pouvons-nous pas déterminer quelque chose à partir de ces parcelles?

rnso

Ça serait bien. Pour plus de clarté, votre question ne porte pas vraiment sur ce qui se passe avec vos données, mais sur ce qui peut être compris de ces parcelles isolément, n'est-ce pas?

gung - Rétablir Monica

Oui. J'ai souvent besoin de déterminer si la saisonnalité est présente dans mes données, je veux donc comprendre quelles informations puis-je tirer des parcelles acf et pacf. Les tracés de la fonction stl sont assez faciles à comprendre, mais pas ces tracés.

rnso

Vos données ont en effet une certaine saisonnalité. Veuillez consulter ma réponse à @javlacalle.

IrishStat

Réponses:

regarder les parcelles pour essayer de classer les données dans un modèle arima deviné fonctionne bien lorsque 1: il n'y a pas de valeurs aberrantes / impulsions / changements de niveau, tendances temporelles locales et aucune impulsion déterministe saisonnière dans les données ET 2) lorsque le modèle arima a paramètres constants dans le temps ET 3) lorsque la variance d'erreur du modèle arima a une variance constante dans le temps. Quand ces trois choses tiennent-elles ... dans la plupart des ensembles de données de manuels scolaires présentant la facilité de la modélisation arima. Quand 1 ou plusieurs des 3 ne tiennent-ils pas ... dans chaque ensemble de données du monde réel que j'ai jamais vu. La réponse simple à votre question nécessite l'accès aux faits originaux (les données historiques) et non aux informations descriptives secondaires de vos graphiques. Mais ce n'est que mon avis!

MODIFIÉ APRÈS RÉCEPTION DES DONNÉES:

J'étais en vacances en Grèce (en train de faire autre chose que l'analyse des séries chronologiques) et je n'ai pas pu analyser les DONNÉES SUR LE SUICIDE, mais en conjonction avec ce post. Il est maintenant approprié et juste que je soumette une analyse pour suivre / prouver par l'exemple mes commentaires sur les stratégies d'identification de modèle à plusieurs étapes et les échecs de l'analyse visuelle simple des graphiques de corrélation simples car "la preuve est dans le pudding".

Voici l'ACF des données originales entrez la description de l'image ici Le PACF de la série originale . AUTOBOX http://www.autobox.com/cms/ un logiciel que j'ai aidé à développer utilise des heuristiques pour identifier un modèle de départ Dans ce cas, le modèle initialement identifié s'est avéré être . La vérification diagnostique des résidus de ce modèle a suggéré une augmentation du modèle en utilisant un décalage de niveau, des impulsions et une impulsion saisonnière. Toutes les routes ne mènent pas à Rome mais certaines peuvent vous rapprocher! entrez la description de l'image ici . Le test de constance des paramètres a rejeté les changements de paramètres au fil du temps. La vérification des changements déterministes dans la variance d'erreur a conclu qu'aucun changement déterministe n'a été détecté dans la variance d'erreur. . Le test de Box-Cox pour la nécessité d'une transformée de puissance était positif avec la conclusion qu'une transformée logarithmique était nécessaire. entrez la description de l'image ici . Le modèle final est ici . Les résidus du modèle final semblent exempts de toute autocorrélation . Le tracé des résidus des modèles finaux semble être exempt de toute violation gaussienne . L'intrigue d'Actual / Fit / Forecasts est ici avec des prévisions ici entrez la description de l'image ici

IrishStat
la source

Merci pour votre réponse. Ces hypothèses sont-elles si importantes et toujours si bafouées dans les données du monde réel que les parcelles acf et pacf ne peuvent presque jamais être interprétées isolément?

rnso

Je déteste dire jamais MAIS les hypothèses que j'ai énoncées compliqueraient gravement le processus d'identification visuelle si elles étaient violées. Vos données clairement (à mes yeux) en sont un exemple. L'identification d'un modèle initial, l'estimation et la réidentification sur la base de diagnostics résiduels est un processus en plusieurs étapes et non effectué SAUF dans des cas triviaux.

IrishStat

Pour répéter en suivant mon ami stats.stackexchange.com/users/48766/javlacalle : Vérifier la présence d'impulsions et de changements de niveau ET d'impulsions saisonnières ET de tendances temporelles locales ET de constance de la variance d'erreur est également nécessaire.

IrishStat

(+1) Belle analyse des données. Mais qu'en est-il de la question d'origine? la saisonnalité peut-elle être identifiée dans les données? Peut-être que cela peut être déduit de la sortie que vous montrez, mais je n'ai pas pu le comprendre.

javlacalle

la saisonnalité est présente dans le terme AR (12) dans le modèle ARIMA et dans le pouls saisonnier à partir de la période 98 (2003/2)

IrishStat

Interprétation de l'ACF et du PACF

La décroissance lente de la fonction d'autocorrélation suggère que les données suivent un long processus de mémoire. La durée des chocs est relativement persistante et influence les données plusieurs observations à venir. Cela est probablement reflété par une tendance régulière dans les données.

L'ACF et le PACF d'ordre 12 sont au-delà des bandes de confiance significatives. Cependant, cela ne signifie pas nécessairement la présence d'un modèle saisonnier identifiable. L'ACF et le PACF des autres commandes saisonnières (24, 36, 48, 60) se situent dans les bandes de confiance. À partir du graphique, il n'est pas possible de conclure si l'importance de l'ACF et du PACF d'ordre 12 est due à la saisonnalité ou aux fluctuations transitoires.

La persistance de l'ACF mentionnée précédemment suggère que des premières différences peuvent être nécessaires pour rendre les données stationnaires. Cependant, l'ACF / PACF de la série différenciée semble suspect, une corrélation négative peut avoir été induite par le filtre de différenciation et peut ne pas être réellement appropriée. Voir cet article pour plus de détails.

Déterminer si la saisonnalité est présente

L'analyse de l'ACF et du PACF doit être complétée par d'autres outils, par exemple:

Le spectre (une vue de l'ACF dans le domaine fréquentiel) peut révéler la périodicité des cycles qui expliquent l'essentiel de la variabilité des données.
Ajuster le modèle de série chronologique structurel de base et vérifier si la variance de la composante saisonnière est proche de zéro par rapport aux autres paramètres (dans la fonction R stats::StructTSet le package stsm ).
Tests de saisonnalité, basés sur des variables fictives saisonnières, des cycles saisonniers ou ceux décrits et mis en œuvre dans X-12 .
La vérification de la présence d'impulsions et de décalages de niveau comme mentionné par IrishStat est également nécessaire car elles peuvent fausser les conclusions des méthodes précédentes (dans R, le paquet tsoutliers peut être utile à cette fin).

javlacalle
la source

J'ai ajouté le tracé jusqu'à un décalage de 60. Quelle serait la commande R pour obtenir des "séries différenciées"? J'ajouterai des tracés pour diff (my_series).

rnso

@mso J'ai ajouté des changements majeurs à ma réponse précédente. La commande pour la série différenciée est la fonction diffque vous avez utilisée.

javlacalle

javlacalle - il y avait deux paragraphes très similaires et @rnso a tenté d'aider en en supprimant un. J'ai supprimé ce que je pense être celui que vous vouliez remplacer. Pourriez-vous s'il vous plaît vérifier que le bon paragraphe a été supprimé?

Glen_b -Reinstate Monica

@Glen_b merci pour l'édition, j'ai fait quelques changements.

javlacalle

@ javlacalle, @IrishStat: veuillez voir la modification dans ma question concernant les données originales.

rnso