Comment comprendre SARIMAX intuitivement?

27

J'essaie de comprendre un article sur la prévision de la charge électrique, mais je me bats avec les concepts à l'intérieur, en particulier le modèle SARIMAX . Ce modèle est utilisé pour prédire la charge et utilise de nombreux concepts statistiques que je ne comprends pas (je suis un étudiant en informatique de premier cycle - vous pouvez me considérer comme un profane en statistique). Il n'est pas nécessaire pour moi de comprendre complètement comment cela fonctionne, mais j'aimerais au moins comprendre intuitivement ce qui se passe.

J'ai essayé de diviser SARIMAX en petits morceaux et d'essayer de comprendre chacun de ces morceaux séparément, puis de les assembler. Pouvez-vous m'aider? Voici ce que j'ai jusqu'à présent.

J'ai commencé avec AR et MA.

AR : autorégressif . J'ai appris ce qu'est une régression et d'après ma compréhension, elle répond simplement à la question: étant donné un ensemble de valeurs / points, comment puis-je trouver un modèle qui explique ces valeurs? Nous avons donc, par exemple, la régression linéaire, qui essaie de trouver une droite qui peut expliquer tous ces points. Une autorégression est une régression qui tente d'expliquer les valeurs à l'aide de leurs valeurs précédentes.

MA : Moyenne mobile . Je suis en fait assez perdu ici. Je sais ce qu'est une moyenne mobile, mais le modèle de moyenne mobile ne semble avoir rien à voir avec la moyenne mobile "normale". La formule du modèle semble étrangement similaire à AR et je n'arrive pas à comprendre l'un des concepts que je trouve sur Internet. Quel est le but de MA? Quelle est la différence entre MA et AR?

Alors maintenant, nous avons ARMA. Le I vient alors d' Integrated , qui, à ce que j'ai compris, sert simplement à permettre au modèle ARMA d'avoir une tendance, soit à la hausse, soit à la baisse. (Est-ce que cela revient à dire qu'ARIMA lui permet d'être non stationnaire?)

Vient maintenant le S de saisonnier , qui ajoute de la périodicité à ARIMA, qui dit essentiellement, par exemple dans le cas de la prévision de charge, que la charge semble très similaire tous les jours à 18 heures.

Enfin le X , issu de variables exogènes , qui permet essentiellement de prendre en compte des variables externes dans le modèle, comme les prévisions météorologiques.

Nous avons donc enfin SARIMAX! Mes explications sont-elles correctes? Reconnaissez que ces explications ne doivent pas nécessairement être rigoureusement correctes. Quelqu'un peut-il m'expliquer ce que MA fait intuitivement?

Choc
la source
6
Votre intuition selon laquelle le modèle de moyenne mobile ne semble avoir rien à voir avec la moyenne mobile "normale" est saine. Voir par exemple: Pourquoi les modèles de séries temporelles MA (q) sont-ils appelés «moyennes mobiles»?
Graeme Walsh

Réponses:

15

Comme vous l'avez noté, (1) un modèle AR relie la valeur d'une observation au temps aux valeurs précédentes, avec une erreur: en , puis : Prenant cela à l'infini: Vous pouvez écrire n'importe quel AR (stationnaire) AR ( ) comme MA (t x t = ϕ x t - 1 + ε t x t - 1 x t - 2 x txt

Xt=ϕXt-1+εt
Xt-1Xt-2
Xt=ϕ(ϕXt-2+εt-1)+εt=ϕ2Xt-2+ϕεt-1+εt=ϕ3Xt-3+ϕ2εt-2+ϕεt-1+εt
Xt=ϕnXt-n+ϕn-1εt-n+1+...+ϕεt-1+εt
p ), bien que vous rencontriez bien sûr une pile de termes géants les uns sur les autres avec .p>1

Cela dit, reformulons maintenant notre définition (1). Un processus AR relie la valeur d'une observation au temps à une séquence infinie de chocs d'erreur en décomposition de périodes antérieures (que nous n'observons pas directement).Xt ε

Donc, ce qu'est un processus de MA pourrait être plus clair maintenant. (2) Un processus MA ( ) relie la valeur d'une observation au temps à seulement chocs d'erreur de périodes antérieures (que nous n'observons pas directement), dont les coefficients peuvent varier davantage que la décroissance exponentielle implicite dans un modèle AR. Comme vous le constatez, cela n'a rien à voir avec le concept habituel de «moyenne mobile».x t qqXtq

Avec certaines conditions sur les coefficients d'un processus MA ( ), nous pouvons en fait faire quelque chose de très similaire à ce que j'ai montré pour un processus AR ci-dessus, c'est-à-dire écrire le MA ( ) comme AR ( ). Il est donc tout aussi valable de reformuler (2) pour dire qu'un processus MA relie la valeur d'une observation au temps à une séquence de décroissance de toutes les valeurs antérieures de . q q x t xθ1...θqqqXtX

Ainsi, un modèle ARMA combine simplement ces deux idées, reliant à la fois à une séquence de décroissance infinie et à une séquence définie. ARIMA ajoute simplement une différenciation au mélange, c'est-à-dire que vous exécutez ARMA sur (ou d'autres différences, le cas ), pour supprimer la tendance, comme vous l'avez noté.x t - x t - 1XtXt-Xt-1

Affine
la source
Salut Affine, merci pour la réponse rapide! Puis-je dire que MA est comme un AR pour l'erreur?
Clash
Sorte de. L'idée clé est que l'AR peut être transformé en un MA en décomposition de longueur infinie, et vice versa. Ainsi, toute signification intuitive que vous attribuez à l'une - AR = associe l'observation actuelle aux observations précédentes - peut être affectée à l'autre - MA = associe l'observation actuelle à toutes les observations précédentes. Ou comme je l'ai abordé à l'origine dans ma réponse - AR = relier l'observation actuelle à tous les "chocs" d'erreur précédents, MA = relier l'observation actuelle à "chocs" d'erreur précédents. qpq
Affine