Déterminer la meilleure série chronologique corrélée

8

Avant de poser la question, j'ai lu des questions similaires, mais aucune d'entre elles ne conduit à des réponses satisfaisantes pour mon intérêt spécifique.

Je veux homogénéiser une série chronologique de précipitations de la République Dominicaine sur 64 ans (1940-2003). Pour cela, il est vraiment important de sélectionner une série de référence parmi un groupe de candidats.

Disons que sjoc'est la série de base, pour laquelle je veux trouver une bonne série de référence; bani, plcet rasont des candidats de référence, car ils sont proches sjo. Dans la carte suivante, le point rouge est la station de base et les verts sont les candidats de référence:

J'ai effectué trois analyses de corrélation (faites en R, fonction cor()), en tenant compte de ces variables mensuelles: valeur de précipitation brute, différence normalisée et valeurs transformées avec Box-Cox. Ces variables correspondent respectivement aux champs qui commencent par p, dianet pnorm.

La différence normalisée provient de la première méthode des séries de différences (FDM), qui a été proposée par Peterson, consistant à: [PmtPmt1]/[Pmt+Pmt1], où Pmt est la valeur des précipitations pour le mois m, et Pmt1est la précipitation du même mois 1 an auparavant. J'ai suivi la remarque de Peterson et ses collègues (1998) , qui dit que le FDM appliqué aux précipitations pourrait mieux fonctionner en utilisant la différence normalisée.

Comme on peut le voir à la page 1 de ce fichier PDF , la corrélation a été calculée pour toute la série chronologique (1940-2003). Pour les précipitations brutes et les valeurs transformées de Box-Cox, baniest la meilleure corrélation avec sjo(les cellules de fond jaune indiquent l'indice de corrélation maximal). Notez que pour les précipitations brutes, baniest significativement plus corrélé que les autres. Pour la différence normalisée, raest seulement un peu plus corrélé que le reste. Cependant, chaque station candidate a un indice de corrélation statistiquement significatif avec sjoauα=.05 niveau de signification, ce qui suggère qu’UN d’entre eux pourrait être utilisé comme série de référence.

C'est un peu déroutant, donc je n'étais pas satisfait et j'ai décidé de faire une analyse plus détaillée, en divisant la série en intervalles de 5 ans et en évaluant la corrélation entre les séries pour les mêmes 3 variables: précipitations brutes, différence normalisée et transformée Box-Cox .

Les tableaux des pages 2 à 8 du PDF montrent les résultats de ces corrélations partielles; la dernière page résume les moments où chaque station a eu la valeur de corrélation maximale pour chaque variable. Comme on peut le voir, baniest la valeur la plus fréquemment corrélée pour les 3 variables analysées (dans tous les cas, plus de 7 fois sur les douze périodes de 5 ans analysées).

Avec ces résultats, je pense que banic'est le meilleur candidat comme série de référence sjo, mais je n'en suis pas sûr. L'analyse de la période de cinq ans est-elle OK? Dois-je effectuer une autre analyse?

JoseRamon
la source
Merci @Nick pour les corrections, j'ai beaucoup appris d'eux. Désolé, l'anglais n'est pas ma langue maternelle.
JoseRamon
Heureux de vous aider :) Votre travail était déjà plus clair que celui de nombreux locuteurs natifs! Mes changements n'étaient que cosmétiques et techniques, pas essentiels. Bienvenue sur CV BTW!
Nick Stauner
les corrélations sont importantes, mais les différences entre ces corrélations sont-elles différentes? sinon, vous ne pouvez pas choisir une station de référence sur une autre en fonction des corrélations
Aksakal
Merci @Aksakal pour votre commentaire. Pour toute la période analysée, et exclusivement pour les précipitations brutes, 'sjo' (la série de base) a ces indices de corrélation avec les candidats de référence: 0,650 avec 'bani', 0,536 avec 'plc' et 0,557 avec 'ra'. Le plus grand indice est-il significativement supérieur au prochain plus corrélé? Concernant les autres variables, différence normalisée et Box-Cox transformée, la différence n'est pas grande. Dois-je appliquer une autre analyse? Que me suggéreriez-vous?
JoseRamon
@JoseRamon, je ne peux pas répondre à ces questions, vous avez les données. Vous pouvez exécuter les tests statistiques pour voir si la différence est significative
Aksakal

Réponses:

1

que diriez-vous d'essayer un Anova bidirectionnel ET un test par paire que ce soit avec vos données annuelles et / ou les intervalles de période de 5 ans. Vous pouvez également le faire avec les données brutes normalisées ou les données Box-Cox.

L'idée est que vous pouvez rechercher toute différence non significative (pour la station de référence) entre les distributions de précipitations par station.

J'ai trouvé ce lien utile pour démarrer votre propre Two-Way-Anova via R r-tutorial-series-two-way-anova

Sébastien

tester1234
la source
Merci Sebastian pour ta réponse. Je vais essayer ces suggestions, qui semblent très utiles. Je l'ai utilisé dans une autre recherche et est très puissant.
JoseRamon
Bonjour à nouveau @ tester1234. J'essaie de réaliser le test Anova bidirectionnel pour mes données. Sur la base du lien que vous m'avez suggéré: quels devraient être mes deux facteurs? Puis-je dire: quelles variables dois-je mettre dans la fonction 'lm ()'? J'ai des précipitations de 3 stations (pbani, pplc, pra), et je veux savoir laquelle est la mieux corrélée avec une quatrième (psjo). J'ai des données mensuelles regroupées par intervalles de 5 ans (les données peuvent être téléchargées à partir de ce lien ). Merci d'avance
JoseRamon