Que fait PCA avec les données autocorrélées?

9

Juste parce qu'un correspondant a posé une question intéressante concernant les méthodes de calcul de l'autocorrélation, j'ai commencé à jouer avec, presque sans aucune connaissance des séries chronologiques et de l'autocorrélation.

Le correspondant a disposé ses données ( points de données d'une série chronologique) décalées d'un décalage de temps en plus pour avoir une matrice de 32 × 32 données (si je l'ai bien compris) où la première ligne est la donnée d'origine, la deuxième ligne les données sont décalées d' une unité de temps, la ligne suivante d'une autre et ainsi de suite. J'ai réalisé cela en plus en collant l'extrémité à la queue, créant ainsi des ensembles de données "circulaires".3232×321

Ensuite, juste pour regarder ce qui pourrait en sortir, j'ai calculé la matrice de corrélation et à partir de là les principaux composants. Étonnamment, j'ai obtenu l'image d'une décomposition en fréquence, et (encore une fois avec d'autres données) une fréquence, disons qu'avec une période dans les données était dans la première composante principale, et qu'avec quatre périodes était dans le deuxième PC et ainsi de suite (J'ai 6 PC "pertinents" avec valeur propre > 1326>1). J'ai d'abord pensé que cela dépend des données d'entrée, mais maintenant je suppose que c'est systématiquement de cette façon par la construction spéciale de l'ensemble de données avec ses décalages circulaires (également connu sous le nom de matrice "Toeplitz"). Les rotations de la solution PC vers varimax ou d'autres critères de rotation ont donné des résultats légèrement différents, et peut-être intéressants, mais semblent en général fournir une telle décomposition en fréquence.

Voici un lien vers des images que j'ai faites à partir de l' ensemble de données à points; les courbes sont simplement faites à partir des chargements de la matrice de facteurs: on courbe les chargements sur un facteur. La courbe du premier PC1 devrait montrer les amplitudes les plus élevées (à peu près parce qu'elle porte la somme la plus élevée de carrés de charges)32

Des questions:

  • Q1: Est-ce une fonctionnalité de par sa conception? (de PCA avec ce type de jeu de données)
  • Q2: Cette approche est-elle en effet utilisable d'une manière ou d'une autre pour une approche sérieuse de l'analyse fréquence / longueur d'onde?

[mise à jour] voici l'ensemble de données (j'espère qu'il sortira en étant copiable pour vous)

-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4
-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5
-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3
0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1
2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0
4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2
6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4
5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6
3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5
1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3
1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1
0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1
-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0
-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2
-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3
0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1
3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0
5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3
7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5
6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7
7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6
5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7
4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5
3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4
2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3
3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2
5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3
4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5
3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4
2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3
3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2
4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3
Heaumes Gottfried
la source
Merci @amoeba et pour le travail d'édition. Je n'avais vu que deux erreurs que je voulais modifier plus tard, la question est maintenant beaucoup plus agréable!
Gottfried Helms

Réponses:

4

Permettez-moi de convertir mon commentaire précédent en une réponse.

n=32

n=321n×n

Aucune idée si cela peut être utile (Q2). D'après mon expérience, il a tendance à apparaître comme un artefact ennuyeux. C'est-à-dire que les gens ont des données, obtiennent quelque chose ressemblant aux modes de Fourier de l'ACP et commencent à se demander ce qu'ils pourraient signifier, alors qu'ils sont simplement dus à des décalages temporels dans la série temporelle d'origine.

amibe
la source
Eh bien, très bien, merci! Oui, j'ai pensé aux données le long des rangées. Q2 vient aussi parce que je n'ai jamais compris jusqu'à présent comment fonctionne exactement l'analyse de Fourier - et par accident, cela aurait pu être une étape pour obtenir une certaine intuition (mais ce vague espoir semble vraiment être inutile ici ...)
Gottfried Helms
Au fait, cela vous dérangerait-il de partager vos 32 séries chronologiques? Je voudrais insérer un chiffre montrant la matrice de Gram, et je pourrais le faire directement avec vos données.
amoeba
Avez-vous vu le lien dans ma question? Il redirige vers une page Web que j'ai faite en utilisant exce.l Il a 4 ou 5 sous-pages, qui sont sélectionnables par "firefox" dans mon installation par un clic sur la barre d'onglets en bas de l'écran. La première sous-page affiche la liste des données. Cependant verticalement: il faut le prendre comme première ligne dans un nouveau tableau et ajouter 31 lignes en faisant un cycle vers la droite. Si cela ne vous convient pas, je peux également ajouter les données à ma question ...
Gottfried Helms
Oh wow, je ne savais pas que c'était une feuille de calcul en ligne entière, et pas seulement une capture d'écran! Merci.
amoeba