Stationnarité - hypothèses et examen

8

J'examine les captures de rongeurs sur six grilles de piégeage de rongeurs permanentes mesurant 150 x 150 mètres et comprenant 121 stations de piégeage régulièrement espacées de 15 mètres. Il y a six de ces grilles de piégeage sur le site d'étude d'une superficie <1 000 hectares. Je voudrais interpoler les données de capture pour créer une surface krigée d'activité de rongeurs. Une hypothèse d'interpolation est que les données sont stationnaires.

Comme le déclarent Fortin et Dale (2005)

la stationnarité est nécessaire pour faire des inférences à partir d'un modèle qui caractérise le processus de la structure spatiale des données à des emplacements qui ne sont pas échantillonnés.

D'après ce que je comprends, un processus peut être décrit comme stationnaire lorsque ses propriétés statistiques (moyenne et variance) ne varient pas dans l'espace.

Mais la variation dans l'espace n'est-elle pas la raison pour laquelle nous effectuons l'analyse spatiale en premier lieu?

La stationnarité est très souvent introduite dans la littérature sur l'analyse spatiale / géostatistique mais, je n'ai pas encore trouvé de direction solide et d'informations sur

  1. à quelle échelle ou pour quels types d'études, il est raisonnable de supposer que vos données sont stationnaires,
  2. comment examiner et vérifier que les données sont stationnaires, et enfin,
  3. une fois quantifiés d'une manière ou d'une autre, quelle différence entre une zone et la zone suivante qualifie vos données de non stationnaires?

Jusqu'à présent, après avoir examiné la littérature, le concept et l'examen de la stationnarité semblent hautement subjectifs, arbitraires et / ou obscurcis.

Si quelqu'un peut fournir des conseils pratiques sur ce problème, je l'apprécierais beaucoup!

user18913
la source
Vous pourriez être intéressé par cette discussion dans un fil étroitement lié.
whuber

Réponses:

2

Il y a toujours deux façons de calculer des statistiques avec le genre de choses dont vous parlez:

  1. Calculez les statistiques dans une même grille.
  2. Calculez des statistiques entre différentes grilles.

Maintenant, il n'y a aucune raison pour que les propriétés statistiques au sein d'une grille doivent correspondre aux caractéristiques statistiques entre les grilles. Ils pourraient en théorie être complètement différents, c'est-à-dire que l'un pourrait être dans un champ de mines sans rats et l'autre pourrait être au centre-ville de Baltimore. De toute évidence, la distribution des rats serait très différente selon la façon dont je tranche les données, c'est-à-dire entre les grilles ou à l'intérieur des grilles.

La stationnarité est l'hypothèse que les statistiques que vous calculez sont les mêmes quelle que soit la façon dont vous avez découpé les données. En pratique, vous pouvez «examiner et vérifier que les données sont stationnaires» en analysant les moyennes, les variances, les histogrammes, etc., au sein des sites, puis entre les sites, et en vérifiant si elles sont identiques, à des intervalles de confiance. Il n'y a pas de règles strictes et rapides; vous faites de votre mieux avec les données dont vous disposez et les techniques à votre disposition, essayez de les justifier mathématiquement et présentez des résultats pratiques. Je dirais que vous pouvez justifier vos méthodes si vous pouvez montrer la stationnarité de cette manière à un intervalle de confiance standard, disons 95% ou 99%.

rajb245
la source
3
Bien que cela ait un sens en général, il me semble qu'il est un peu en contradiction avec la pratique habituelle des statistiques spatiales. Là, la stationnarité est une décision prise par le modélisateur, pas une propriété inhérente d'un processus ou des données. Il ne fait pas nécessairement référence aux données mais aux résidus d'une tendance externe, ou «dérive». Dans votre exemple de rats, les différences de nombres attendus de rats avec l'emplacement pourraient être modélisées avec une dérive et la partie stochastique du modèle pourrait être considérée comme stationnaire.
whuber