Supposons que l'on dispose d'une série chronologique à partir de laquelle on peut prendre diverses mesures telles que la période, le maximum, le minimum, la moyenne, etc., puis les utiliser pour créer un modèle d'onde sinusoïdale avec les mêmes attributs. dans quelle mesure les données réelles correspondent-elles au modèle supposé? Le nombre de points de données dans la série se situerait entre 10 et 50 points.
Une première pensée très simpliste était d'attribuer une valeur au mouvement directionnel de l'onde sinusoïdale, c'est-à-dire +1 +1 +1 +1 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1 +1, faites de même avec les données réelles, puis quantifiez en quelque sorte le degré de similitude du mouvement directionnel.
Edit: Après avoir réfléchi à ce que je veux vraiment faire avec mes données, et à la lumière des réponses à ma question d'origine, j'ai besoin d'un algorithme de prise de décision pour choisir entre des hypothèses concurrentes: à savoir que mes données sont fondamentalement linéaires (ou tendance) avec du bruit qui pourrait éventuellement avoir des éléments cycliques; mes données sont essentiellement cycliques, sans tendance directionnelle à proprement parler; les données ne sont essentiellement que du bruit; ou il est en transition entre l'un de ces états.
Mes pensées sont maintenant de combiner peut-être une certaine forme d'analyse bayésienne et métrique euclidienne / LMS. Les étapes de cette approche seraient les suivantes:
Créer l'onde sinusoïdale supposée à partir des mesures de données
Ajuster une ligne droite LMS aux données
Dériver une métrique euclidienne ou LMS pour les écarts par rapport aux données d'origine pour chacun des éléments ci-dessus
Créer un prior bayésien pour chacun basé sur cette métrique c'est-à-dire que 60% des départs combinés s'attachent à l'un, 40% à l'autre, favorisent donc les 40%
faites glisser une fenêtre d'un point de données le long des données et répétez ce qui précède pour obtenir de nouvelles mesures de% pour cet ensemble de données légèrement modifié - ce sont les nouvelles preuves - faites l'analyse bayésienne pour créer un postérieur et changer les probabilités qui favorisent chaque hypothèse
répéter tout le jeu de données (3000+ points de données) avec cette fenêtre coulissante (longueur de fenêtre 10-50 points de données). L'espoir / l'intention est d'identifier l'hypothèse prédominante / favorisée à tout moment dans l'ensemble de données et comment cela change avec le temps
Tout commentaire sur cette méthodologie potentielle serait le bienvenu, en particulier sur la façon dont je pourrais réellement mettre en œuvre la partie analyse bayésienne.
la source
Votre «première pensée simpliste» consistant à représenter qualitativement le mouvement directionnel est similaire dans son esprit à l'algorithme SAX de Keogh pour comparer les séries chronologiques. Je vous recommande d'y jeter un œil: Eamonn Keogh & Jessica Lin: SAX .
D'après votre montage, il semble que vous envisagez maintenant de résoudre le problème différemment, mais vous constaterez peut-être que SAX fournit une pièce du puzzle.
la source
Bien que je sois un peu en retard pour la fête, si vous pensez à quelque chose de sinusoïdal, les transformées en ondelettes sont également un bon outil à avoir dans votre poche. En théorie, vous pouvez utiliser des transformées en ondelettes pour décomposer une séquence en différentes "parties" (par exemple, des vagues de formes / fréquences différentes, des composants non ondulatoires tels que des tendances, etc.). Une forme spécifique de transformation d'onde qui est utilisée une tonne est la transformée de Fourier, mais il y a beaucoup de travail dans ce domaine. J'adorerais pouvoir recommander un package actuel, mais je n'ai pas fait d'analyse de signal depuis un bon moment. Je me souviens cependant de certains packages Matlab prenant en charge les fonctionnalités de cette veine.
Une autre direction à suivre si vous essayez seulement de trouver des tendances dans les données cycliques est quelque chose comme le test de tendance de Mann-Kendall. Il est beaucoup utilisé pour des choses comme la détection des changements météorologiques ou de la qualité de l'eau, qui ont de fortes influences saisonnières. Il n'a pas les cloches et les sifflets de certaines approches plus avancées, mais comme il s'agit d'un test statistique vétéran, il est assez facile à interpréter et à rapporter.
la source