Comment ACF & PACF identifie-t-il l'ordre des termes MA et AR?

12

Cela fait plus de 2 ans que je travaille sur différentes séries chronologiques. J'ai lu sur de nombreux articles qu'ACF est utilisé pour identifier l'ordre des termes MA et PACF pour AR. Il y a une règle générale selon laquelle pour MA, le décalage où ACF s'arrête soudainement est l'ordre de MA et de même pour PACF et AR.

Voici l' un des articles que j'ai suivis du PennState Eberly College of Science.

Ma question est pourquoi est-ce ainsi? Pour moi, même ACF peut donner un terme AR. J'ai besoin d'une explication de la règle générale mentionnée ci-dessus. Je ne suis pas en mesure de comprendre la règle du pouce de manière intuitive / mathématique, pourquoi -

L'identification d'un modèle AR est souvent mieux effectuée avec le PACF.
L'identification d'un modèle d'AMM est souvent mieux effectuée avec l'ACF plutôt qu'avec le PACF

Veuillez noter: - Je n'ai pas besoin de savoir comment mais "POURQUOI". :)

Arpit Sisodia
la source

Réponses:

9

Les citations proviennent du lien dans le PO:

L'identification d'un modèle AR est souvent mieux effectuée avec le PACF.

Pour un modèle AR, le PACF théorique «s'arrête» au-delà de l'ordre du modèle. L'expression «éteint» signifie qu'en théorie, les autocorrélations partielles sont égales à 0 au-delà de ce point. Autrement dit, le nombre d'autocorrélations partielles non nulles donne l'ordre du modèle AR. Par «ordre du modèle», nous entendons le décalage le plus extrême de x utilisé comme prédicteur.

... une autorégression d'ordre , écrite comme AR (k), est une régression linéaire multiple dans laquelle la valeur de la série à tout moment t est une fonction (linéaire) des valeurs à des momentsktht1,t2,,tk:

yt=β0+β1yt1+β2yt2++β2ytk+ϵt.

Cette équation ressemble à un modèle de régression, comme indiqué sur la pagination liée ... Alors quelle est une intuition possible de ce que nous faisons ...

Dans les chuchotements chinois ou le jeu téléphonique comme illustré ici

entrez la description de l'image ici

le message est déformé car il est chuchoté de personne à personne, et toutes les traces de ressemblance (tous les mots véridiques, si vous voulez) sont perdues après le participant rouge (à l'exception de l'article 'a'). Le PACF nous dirait que les coefficients pour les participants bleus et jaunes ne sont pas contributifs une fois que l'effet des participants marron et rouge est pris en compte (le participant vert à la fin de la ligne ne déforme pas le message).

Il n'est pas difficile de s'approcher très près de la sortie réelle de la fonction R en obtenant réellement des régressions OLS consécutives à travers l'origine de séquences plus retardées et en collectant les coefficients dans un vecteur. Schématiquement,

entrez la description de l'image ici

un processus très similaire au jeu téléphonique - il arrivera un moment où il n'y aura pas de variabilité dans le signal de la série temporelle initiale réelle trouvée dans des extraits de plus en plus éloignés de lui-même.


L'identification d'un modèle d'AMM est souvent mieux effectuée avec l'ACF plutôt qu'avec le PACF .

Pour un modèle MA, le PACF théorique ne s'arrête pas, mais se rétrécit plutôt vers 0 d'une certaine manière. Un modèle plus clair pour un modèle MA se trouve dans l'ACF. L'ACF aura des autocorrélations non nulles uniquement aux décalages impliqués dans le modèle.

Un terme moyen mobile dans un modèle de série chronologique est une erreur passée (multipliée par un coefficient).

Le modèle de moyenne mobile d'ordre , noté MA (q) estqth

xt=μ+wt+θ1wt1+θ2wt2++θqwtq

avecwtiidN(0,σw2).

Ici, ce n'est pas la ressemblance du message à travers les points temporels qui est recherchée en arrière dans le temps pas à pas, mais plutôt la contribution du bruit, que j'imagine comme les écarts souvent massifs qu'une marche aléatoire peut entraîner le long de la ligne du temps:

entrez la description de l'image ici

Ici, il existe de multiples séquences progressivement décalées qui sont corrélées, rejetant toute contribution des étapes intermédiaires. Ce serait le graphique des opérations impliquées:entrez la description de l'image ici

À cet égard, "CV is cool!" n'est pas complètement différent de "Naomi a une piscine". Du point de vue du bruit, les rimes sont toujours là jusqu'au début du jeu.

Antoni Parellada
la source
Ceci est une réponse vraiment cool, bon travail (+1)
Firebug
Rob Hyndman suggère cette stratégie pour ARIMA, qui utilise à la fois pacf et acf pour déterminer les commandes. Avons-nous besoin de savoir à l'avance quelle série nous devons utiliser la stratégie décrite dans votre réponse? Merci!
stucash
Veuillez prendre ma réponse comme un exercice didactique. Je ne suis pas expert en la matière.
Antoni Parellada
4

Robert Nau de la Fuqua School of Business de Duke donne une explication détaillée et quelque peu intuitive de la façon dont les tracés ACF et PACF peuvent être utilisés pour choisir les commandes AR et MA ici et ici . Je résume brièvement ses arguments ci-dessous.

Une explication simple de la raison pour laquelle PACF identifie l'ordre AR

Les autocorrélations partielles peuvent être calculées en ajustant une séquence de modèles AR en commençant par le premier décalage uniquement et en ajoutant progressivement plus de décalages. Le coefficient de décalage dans un modèle AR ( ) donne l'autocorrélation partielle au décalage . Compte tenu de cela, si l'autocorrélation partielle "coupe" / cesse d'être significative à un certain décalage (comme on le voit dans un graphique ACF), cela indique que ce décalage n'ajoute pas de pouvoir explicatif à un modèle et donc que l'ordre AR doit être le décalage précédent.kkk

Une explication plus complète qui traite également de l'utilisation d'ACF pour identifier la commande MA

Les séries chronologiques peuvent avoir des signatures AR ou MA:

  • Une signature AR correspond à un tracé PACF affichant une coupure nette et un ACF en décomposition plus lente;
  • Une signature MA correspond à un tracé ACF affichant une coupure nette et un tracé PACF qui se désintègre plus lentement.

Les signatures AR sont souvent associées à une autocorrélation positive au décalage 1, ce qui suggère que la série est légèrement "sous-différenciée" (cela signifie qu'une différenciation supplémentaire est nécessaire pour éliminer complètement l'autocorrélation). Comme les termes AR atteignent une différenciation partielle (voir ci-dessous), cela peut être corrigé en ajoutant un terme AR au modèle (d'où le nom de cette signature). Par conséquent, un tracé PACF avec une coupure nette (accompagné d'un tracé ACF en décomposition lente avec un premier décalage positif) peut indiquer l'ordre du terme AR. Nau le dit comme suit:

Si le PACF de la série différenciée affiche une coupure nette et / ou l'autocorrélation lag-1 est positive - c'est-à-dire, si la série apparaît légèrement "sous-différenciée" - alors envisagez d'ajouter un terme AR au modèle. Le décalage auquel le PACF s'arrête est le nombre indiqué de termes AR.

Les signatures MA, en revanche, sont généralement associées à des premiers décalages négatifs, suggérant que la série est "surdifférenciée" (c'est-à-dire qu'il est nécessaire d'annuler partiellement la différenciation pour obtenir une série stationnaire). Étant donné que les termes MA peuvent annuler un ordre de différenciation (voir ci-dessous), le tracé ACF d'une série avec une signature MA indique l'ordre MA nécessaire:

Si l'ACF de la série différenciée affiche une coupure nette et / ou l'autocorrélation lag-1 est négative - c'est-à-dire si la série apparaît légèrement "surdifférenciée" - alors envisagez d'ajouter un terme MA au modèle. Le décalage auquel l'ACF se termine est le nombre indiqué de termes MA.

Pourquoi les termes AR atteignent une différenciation partielle et les termes MA annulent partiellement la différenciation précédente

Prenez un modèle ARIMA (1,1,1) de base, présenté sans la constante pour plus de simplicité:

yt=YtYt1

yt=ϕyt1+etθet1

En définissant comme opérateur de décalage / rétrogradation , cela peut être écrit comme suit:B

yt=(1B)Yt

yt=ϕByt+etθBet

qui peut être encore simplifié pour donner:

(1ϕB)yt=(1θB)et

ou équivalent:

(1ϕB)(1B)Yt=(1θB)et .

Nous pouvons voir que le terme AR (1) nous a donné le terme , augmentant ainsi partiellement (if ) l'ordre de différenciation. De plus, si nous manipulons comme une variable numérique (ce que nous pouvons faire car c'est un opérateur linéaire), nous pouvons voir que le terme MA (1) nous a donné le terme , annulant ainsi partiellement le terme de différenciation d'origine - - dans la partie gauche.ϕ ( 0 , 1 ) B ( 1 - θ B ) ( 1 - B )(1ϕB)ϕ(0,1)B(1θB)(1B)

George Costanza
la source
2

À un niveau supérieur, voici comment le comprendre. (Si vous avez besoin d'une approche plus mathématique, je peux volontiers consulter certaines de mes notes sur l'analyse des séries chronologiques)

ACF et PACF sont des constructions statistiques théoriques tout comme une valeur ou une variance attendue, mais sur des domaines différents. De la même manière que les valeurs attendues apparaissent lors de l'étude des variables aléatoires, ACF et PACF apparaissent lors de l'étude des séries chronologiques.

Lors de l'étude des variables aléatoires, il y a la question de savoir comment estimer leurs paramètres, c'est-à-dire où la méthode des moments, le MLE et d'autres procédures et constructions entrent en jeu, ainsi que l'inspection des estimations, leurs erreurs types, etc.

L'inspection de l'ACF et du PACF estimés provient de la même idée, estimer les paramètres d'un processus de séries chronologiques aléatoires. Vous avez l'idée?

Si vous pensez que vous avez besoin d'une réponse plus mathématique, faites-le moi savoir, et je vais essayer de voir si je peux créer quelque chose d'ici la fin de la journée.

Guilherme Marthe
la source