Analyse de la corrélation croisée entre les processus ponctuels

15

Je voudrais un conseil sur une méthode d'analyse que j'utilise, pour savoir si elle est statistiquement valable.

J'ai mesuré deux points processus et T 2 = T 2 1 , T 2 2 , . . . , t 2 m et je veux déterminer si les événements de T 1 sont en quelque sorte corrélés aux événements de T 2 .T1=t11,t21,...,tn1T2=t12,t22,...,tm2T1T2

L'une des méthodes que j'ai trouvées dans la littérature est celle de construire un histogramme de corrélation croisée: pour chaque on retrouve le retard à tous les événements de T 2 qui tombent dans une fenêtre de temps donnée (avant et après t 1 n ), puis on construit un histogramme de tous ces retards.tn1T2tn1

Si les deux processus ne sont pas corrélés, je m'attendrais à un histogramme plat, car la probabilité d'avoir un événement dans après (ou avant) un événement dans T 1 est égale à tous les retards. D'un autre côté, s'il y a un pic dans l'histogramme, cela suggère que les processus à deux points s'influencent d'une manière ou d'une autre (ou, au moins, ont une entrée commune).T2T1

Maintenant, c'est agréable et bon, mais comment puis-je déterminer si les histogrammes ont un pic (je dois dire que pour mon ensemble particulier de données, ils sont clairement plats, mais il serait quand même bien d'avoir une méthode statistique de confirmant cela)?

T1T2T2

times2.swp <- cumsum(sample(diff(times2)))

T2T1

T2T1

Je prendrais alors cette valeur de 95% pour tous les délais et je l'utiliserais comme une "limite de confiance" (probablement ce n'est pas le terme correct) afin que tout ce qui dépasse cette limite dans l'histogramme d'origine puisse être considéré comme un "vrai" de pointe".

Question 1 : cette méthode est-elle statistiquement correcte? Sinon, comment aborderiez-vous ce problème?

Question 2 : une autre chose que je veux voir est de savoir s'il existe un type de corrélation "plus long" de mes données. Par exemple, il peut y avoir des changements similaires dans le taux d'événements dans les processus à deux points (notez qu'ils peuvent avoir des taux assez différents), mais je ne sais pas comment procéder. J'ai pensé à créer une «enveloppe» de chaque processus ponctuel en utilisant une sorte de noyau de lissage, puis à effectuer une analyse de corrélation croisée des deux enveloppes. Pourriez-vous suggérer tout autre type d'analyse possible?

Merci et désolé pour cette très longue question.

Nico
la source

Réponses:

11

Une méthode standard pour analyser ce problème en deux dimensions ou plus est la fonction K (croisée) de Ripley , mais il n'y a aucune raison de ne pas l'utiliser également en une seule dimension. (Une recherche Google fait un bon travail de recherche de références.) Essentiellement, il trace le CDF de toutes les distances entre les points dans les deux réalisations plutôt qu'une approximation d'histogramme au format PDF de ces distances. (Une variante, la fonction L, trace la différence entre K et la distribution nulle pour deux processus uniformes non corrélés.) sont généralement créés par simulation. C'est facile à faire dans R. De nombreux packages de statistiques spatiales pour R peuvent être utilisés directement ou facilement adaptés à ce cas 1D. Roger BivandLa page de présentation de CRAN répertorie ces packages: reportez-vous à la section "Analyse des configurations de points".

whuber
la source
Intéressant ... Je suis un peu occupé en ce moment, mais je vais certainement y jeter un œil!
nico