Similitude de deux transformations de Fourier discrètes?

14

Dans la modélisation du climat, vous recherchez des modèles qui peuvent représenter adéquatement le climat de la Terre. Cela inclut des schémas semi-cycliques: des choses comme l'oscillation australe El Nino. Mais la vérification du modèle se produit généralement sur des périodes relativement courtes, où il existe des données d'observation décentes (~ 150 dernières années). Cela signifie que votre modèle peut afficher les bons modèles, mais être déphasé, de sorte que les comparaisons linéaires, comme la corrélation, ne détectent pas que le modèle fonctionne bien.

Les transformées de Fourier discrètes sont couramment utilisées pour analyser les données climatiques ( voici un exemple ), afin de détecter de tels modèles cycliques. Existe-t-il une mesure standard de la similitude de deux DFT qui pourrait être utilisée comme outil de vérification (c'est-à-dire une comparaison entre la DFT pour le modèle et celle pour les observations)?

Serait-il logique de prendre l'intégrale du minimum des deux TFD normalisées en fonction de la surface (en utilisant des valeurs réelles absolues)? Je pense que cela se traduirait par un score , où exactement les mêmes modèles, et des modèles totalement différents. Quels pourraient être les inconvénients d'une telle méthode?x[0,1]x=1x=0

rien101
la source
3
Avez-vous envisagé d'utiliser la cohérence (dans le sens du traitement du signal, pas la statistique), une mesure interspectrale? Je ne sais pas si c'est le type de mesure que vous recherchez.
jonsca
@jonsca: Des trucs intéressants. Je ne recherche certainement pas la causalité, mais je peux voir comment cela pourrait être utile. L'exemple sur cette page wikipedia est un peu bizarre (pourquoi n'inclut-il pas la pression barométrique comme variable de modèle?). De plus, je ne sais pas d'où vient le chiffre de 90% ...
naught101
C'est une bonne question. Cet exemple a été ajouté à l'article depuis la dernière fois que je l'ai lu. Je soupçonne que cela pourrait avoir à voir avec la cohérence centrée sur les fréquences par jour et par 2 jours (donc liées à un phénomène de marée quotidien), mais ce n'est qu'une supposition ...
jonsca
(Je ne sais pas s'ils se sont intégrés pour trouver que 90%, cependant)
jonsca

Réponses:

12

La cohérence spectrale, si elle est utilisée correctement, le ferait. La cohérence est calculée à chaque fréquence et est donc un vecteur. Par conséquent, une somme d'une cohérence pondérée serait une bonne mesure. Vous voudriez généralement pondérer les cohérences à des fréquences qui ont une énergie élevée dans la densité spectrale de puissance. De cette façon, vous mesureriez les similitudes aux fréquences qui dominent la série chronologique au lieu de pondérer la cohérence avec un poids important, lorsque le contenu de cette fréquence dans la série chronologique est négligeable.

Donc, en termes simples, l'idée de base est de trouver les fréquences auxquelles l'amplitude (énergie) dans les signaux sont élevées (interpréter comme les fréquences qui constituent principalement chaque signal) et ensuite de comparer les similitudes à ces fréquences avec un poids plus élevé et comparer les signaux au reste des fréquences avec un poids inférieur.

Le domaine qui traite des questions de ce type est appelé analyse interspectrale. http://www.atmos.washington.edu/~dennis/552_Notes_6c.pdf est une excellente introduction à l'analyse interspectrale.

Décalage optimal: Regardez également ma réponse ici: comment corréler deux séries temporelles, avec des différences de temps possibles

Il s'agit de trouver le décalage optimal, en utilisant la cohérence spectrale. R a des fonctions pour calculer les densités spectrales de puissance, les corrélations automatiques et croisées, les transformées de Fourier et la cohérence. Vous devez coder à droite pour trouver le décalage optimal pour obtenir le max. cohérence pondérée. Cela dit, un code de pondération du vecteur de cohérence à l'aide de la densité spectrale doit également être écrit. Ensuite, vous pouvez résumer les éléments pondérés et les faire la moyenne pour obtenir la similitude observée au décalage optimal.

corbillard
la source
1
Voilà une excellente ressource! Il traite bien des tests d'hypothèses, ce que beaucoup de matériel sur la cohérence évite commodément
jonsca
2

Avez-vous essayé une autre approche pour la détection / modélisation des signaux climatiques, comme une analyse en ondelettes? Le gros problème qui peut survenir avec la DFT dans l'analyse climatique est en fait ce que vous mentionnez: les oscillations ne sont pas parfaitement périodiques et elles ont généralement des intervalles de temps différents, de sorte qu'elles peuvent avoir de nombreuses plages d'oscillations différentes, ce qui est assez déroutant du point de vue de la transformation de Fourier .

Une analyse en ondelettes est plus adaptée aux signaux climatiques car ils vous permettent de vérifier différentes périodes d'oscillation; tout comme différentes fréquences sont jouées à des moments différents par un instrument de musique, vous pouvez vérifier différentes fréquences dans des intervalles de temps différents avec la transformée en ondelettes.

Si vous êtes intéressé, cet article de Lau & Weng (1995) devrait effacer la plupart de vos doutes sur cette méthode. La partie la plus intéressante est que la transformée en ondelettes d'un modèle par rapport à celle des données est presque directement comparable, car vous pouvez comparer directement l'intervalle de temps que votre modèle prédit, en laissant de côté toutes les gammes d'oscillations parasites qu'il ne fait pas.

PS: Je dois ajouter que je voulais poster ceci comme un commentaire, car ce n'est pas vraiment ce que le PO demande, mais mon commentaire aurait été trop grand et j'ai décidé de le poster comme une réponse qui pourrait être utile comme une approche alternative à celle des DFT.

Néstor
la source
1

J'ai voté et appuyé l'utilisation de l'analyse basée sur les ondelettes et le spectrogramme comme alternative à la dft. Si vous pouvez décomposer votre série en bacs temps-fréquence localisés, cela réduit les problèmes d'apériodicité et de non-stationnarité de Fourier, ainsi que fournit un joli profil de données discrétisées à comparer.

Une fois les données mappées à un ensemble tridimensionnel d'énergie spectrale en fonction du temps et de la fréquence, la distance euclidienne peut être utilisée pour comparer les profils. Une correspondance parfaite approcherait la distance limite inférieure de zéro. * Vous pouvez examiner les zones d'exploration de données de séries chronologiques et de reconnaissance vocale pour des approches similaires.

* notez que le processus de regroupement en ondelettes filtrera quelque peu le contenu de l'information - S'il n'y a pas de perte dans les données comparées, il pourrait être plus approprié de comparer en utilisant la distance euclidienne dans le domaine temporel

tapoter
la source