Une façon plus simple de calculer la moyenne mobile à pondération exponentielle?

Méthode proposée:

Étant donné une série temporelle , je veux calculer une moyenne mobile pondérée avec une fenêtre de moyenne de points, où les pondérations favorisent les valeurs plus récentes par rapport aux valeurs plus anciennes. $x_i$ $N$

En choisissant les poids, j'utilise le fait familier qu'une série géométrique converge vers 1, c'est-à-dire , à condition que l'on utilise un nombre infini de termes. $\sum (\frac{1}{2})^k$

Pour obtenir un nombre discret de poids qui résument à l'unité, je prends simplement les premiers termes de la série géométrique , puis je normalise par leur somme. $N$ $(\frac{1}{2})^k$

Lorsque , par exemple, cela donne les poids non normalisés $N=4$

0.0625  0.1250  0.2500  0.5000

qui, après normalisation par leur somme, donne

0.0667  0.1333  0.2667  0.5333

La moyenne mobile est alors simplement la somme du produit des 4 valeurs les plus récentes par rapport à ces poids normalisés.

Cette méthode se généralise de manière évidente pour déplacer des fenêtres de longueur , et semble également facile à calculer. $N$

Question:

Y a-t-il une raison de ne pas utiliser cette méthode simple pour calculer une moyenne mobile pondérée en utilisant des «poids exponentiels»?

Je demande parce que l'entrée Wikipedia pour EWMA semble plus compliquée. Ce qui me fait me demander si la définition classique de l'EWMA a peut-être des propriétés statistiques que la définition simple ci-dessus n'a pas? Ou sont-ils en fait équivalents?

time-series forecasting algorithms weighted-mean Assad Ebrahim
la source

Comment avez-vous normalisé la somme? Pourriez-vous décrire la méthode que vous avez choisie? Ce n'est pas très clair de la poste. qui, après normalisation par leur somme, donne 0,0667 0,1363 0,2667 0,5333

Pour commencer, vous supposez 1) qu'il n'y a pas de valeurs inhabituelles et pas de changements de niveau et pas de tendances temporelles et pas de variables saisonnières; 2) que la moyenne pondérée optimale a des poids qui tombent sur une courbe lisse descriptible par 1 coefficient; 3) que la variance d'erreur est constante; qu'il n'y a pas de série causale connue; Pourquoi toutes les hypothèses?

IrishStat

@Ravi: Dans l'exemple donné, la somme des quatre premiers termes est de 0,9375 = 0,0625 + 0,125 + 0,25 + 0,5. Ainsi, les quatre premiers termes détiennent environ 93,8% du poids total (6,2% dans la queue tronquée). Utilisez-le pour obtenir des poids normalisés qui totalisent l'unité en redimensionnant (divisant) par 0,9375. Cela donne 0,06667, 0,1333, 0,2667, 0,5333.

Assad Ebrahim

@IrishStat Il est préférable de ne pas éloigner les gens du site dans les commentaires ou les réponses, car les conseils que vous donnez hors site ne sont pas liés à la question et n'aident donc pas les lecteurs ultérieurs (par exemple, voir la raison 1. de la première réponse ici ); si c'est un conseil approprié, il devrait généralement être ici.

Glen_b -Reinstate Monica

Explication détaillée de l'EWMA: mathematical-modeling-python.blogspot.dk/2013/11/…

tashuhka

Réponses:

J'ai trouvé que le calcul de moyennes mobiles exponentiellement pondérées en utilisant , est $\overline{x} \leftarrow \overline{x} + \alpha (x - \overline{x})$ $\alpha<1$

une méthode simple sur une ligne,
facilement interprétable, ne serait-ce qu'approximativement, en termes de "nombre effectif d'échantillons" (comparer ce formulaire au formulaire de calcul de la moyenne mobile), $N=\alpha^{-1}$
nécessite uniquement la donnée actuelle (et la valeur moyenne actuelle), et
est numériquement stable.

Techniquement, cette approche intègre toute l'histoire dans la moyenne. Les deux principaux avantages de l'utilisation de la fenêtre complète (par opposition à celle tronquée discutée dans la question) sont que, dans certains cas, cela peut faciliter la caractérisation analytique du filtrage et réduire les fluctuations induites si des données très grandes (ou petites) La valeur fait partie de l'ensemble de données. Par exemple, considérez le résultat du filtre si les données sont toutes nulles à l'exception d'une donnée dont la valeur est . $10^6$

Dave
la source

Salut. La formule que vous avez suggérée inclut-elle toutes les valeurs précédentes avec des poids décroissants de façon exponentielle? Donc, toute la série chronologique serait incluse, pas seulement les points les plus récents ? En vous référant à l' exemple posé dans la question, proposez-vous de définir ou pour approximer la moyenne mobile à 4 points?

N

$N$

N = 4

$N=4$

α = 0.25

$\alpha=0.25$

α = 0.5

$\alpha=0.5$

Assad Ebrahim

Ok, ça a du sens. Il semble donc que dans les cas où les valeurs des séries chronologiques peuvent être affectées par des transitoires importants à court terme qui n'ont plus aucune incidence après un certain laps de temps, il peut être avantageux d'utiliser l'EWMA tronqué avec choisi pour correspondre à cela. caractéristique de pertinence des informations historiques. L'EWMA tronquée dans ce cas empêcherait un pic de avoir un impact sur le résultat même s'il s'est produit dans un passé récent, tant qu'il s'est produit en dehors de la zone de pertinence des informations ... Accepter votre réponse - merci !

N

$N$

10^{6}

$10^6$

Assad Ebrahim