Méthode (s) de pointe pour trouver zéro portion moyenne d'une série chronologique

9

J'ai des séries chronologiques bruyantes que je dois segmenter en ces portions avec une moyenne nulle et ces portions sans moyenne nulle. Il est important de trouver les limites aussi précisément que possible (clairement où la limite se situe précisément est un peu subjectif). Je pense qu'une variante de cusum pourrait être adaptée pour ce faire, mais comme cusum consiste principalement à trouver des changements uniques qui laissent toute la stratégie de segmentation complètement sans réponse.

Je suis sûr qu'un tas de recherches ont été faites sur ce problème mais je n'ai pas pu le trouver.

PS La quantité de données dans ces séries chronologiques est assez grande, c'est-à-dire jusqu'à des centaines de millions d'échantillons, et un échantillon individuel peut être un vecteur avec quelques centaines de composants, donc une méthode qui peut être calculée assez rapidement est un facteur important .

PPS Il n'y a pas de balise de segmentation, d'où la balise de classification.

John Robertson
la source

Réponses:

1

Ce n'est peut-être pas l'état de l'art, mais une méthode intuitive serait de lisser les données en plaçant des poids sur les observations près de chaque point dans le temps. Donc, si vous voulez savoir si l'échantillon R a une moyenne nulle au temps T:

mu(R,T)=w1*Sample(R,T)+w2*Sample(R,T-1)+w3*Sample(R,T+1)....

Peut-être que les poids exponentiels peuvent être un bon choix, selon la définition de la limite.

Après avoir pris soin de certains détails techniques comme la définition au début et à la fin de chaque somple, vous pouvez maintenant simplement tester si chaque mu est suffisamment proche de zéro pour trouver les points où la moyenne est nulle.

Dennis Jaheruddin
la source