Quelle est la différence entre la dépendance spatiale et l'hétérogénéité spatiale?

9

Quelle est la différence entre la dépendance spatiale et l'hétérogénéité spatiale?

Ma question est motivée par des lectures de problèmes de spécification de modèles en économétrie spatiale, en particulier Anselin (2010) .

mindless.panda
la source
1
Une référence serait utile. D'après mon expérience personnelle, toute la terminologie n'est pas encore fixée en économétrie spatiale, c'est-à-dire que différents auteurs peuvent donner des définitions différentes.
mpiktas
1
J'ai le sentiment que Luc Anselin a écrit plus d'un article en 2010! Une citation plus spécifique (plus un lien) serait utile (bien qu'il ait utilisé ces termes depuis son livre Spatial Econometrics imprimé en 1988).
Andy W
Merci pour la suggestion - j'ai ajouté un lien vers le document.
mindless.panda

Réponses:

14

Ces termes n'ont probablement pas de définition technique universellement acceptée, mais leur signification est raisonnablement claire: ils se réfèrent respectivement à la variation de second ordre et de premier ordre d'un processus spatial. Prenons-les par ordre après avoir d'abord présenté certains concepts standard.

Un processus spatial ou un processus stochastique spatial peut être considéré comme un ensemble de variables aléatoires indexées par des points dans un espace. (Les variables doivent satisfaire à certaines conditions de cohérence technique naturelle pour être qualifiées de processus: voir le théorème d'extension de Kolmogorov .)

Notez qu'un processus spatial est un modèle. Il est valide d'utiliser plusieurs modèles différents (conflictuels) pour analyser et décrire les mêmes données. Par exemple, les modèles de concentrations naturelles de métaux dans les sols peuvent être purement stochastiques pour de petites régions (comme un hectare ou moins) alors que sur de grandes régions (s'étendant sur plusieurs kilomètres), il est généralement important de décrire de façon déterministe les tendances régionales sous-jacentes - c'est-à-dire, comme une forme d'hétérogénéité spatiale.

L'hétérogénéité spatiale est une propriété d'un processus spatial dont la moyenne (ou l '"intensité") varie d'un point à un autre.

La moyenne est une propriété de premier ordre d'une variable aléatoire (c'est-à-dire liée à son premier moment), d'où l'hétérogénéité spatiale peut être considérée comme une propriété de premier ordre d'un processus.

La dépendance spatiale est une propriété d'un processus stochastique spatial dans lequel les résultats à différents endroits peuvent être dépendants.

On peut souvent mesurer la dépendance en termes de covariance (deuxième moment) ou de corrélation des variables aléatoires: en ce sens, la dépendance peut être considérée comme une propriété de second ordre. (Sticklers sera rapide à souligner que la corrélation et l'indépendance ne sont pas les mêmes, donc assimiler la dépendance aux propriétés de second ordre, bien qu'intuitivement utile, n'est généralement pas valide.)

Lorsque vous voyez des modèles dans les données spatiales, vous pouvez généralement les décrire comme une hétérogénéité ou une dépendance (ou les deux), en fonction de l'objectif de l'analyse, des informations préalables et de la quantité de données.

Quelques exemples simples et bien étudiés illustrent ces idées.

Processus de Poisson

Sur cette figure, le carré délimite une zone d'intensité spatiale plus élevée. Cependant, tous les emplacements de points sont indépendants: le regroupement et les écarts dans les points sont typiques d'emplacements indépendants choisis au hasard.

Filtre gaussien

La dépendance spatiale dans ce processus gaussien est évidente à travers les modèles de crêtes et de vallées. Ils sont cependant homogènes: il n'y a pas de tendance globale. Notez, cependant, que si nous nous concentrions sur une petite partie de ce domaine, nous pourrions choisir de le traiter comme un processus non homogène (c'est-à-dire avec une tendance). Cela illustre comment l' échelle peut influencer le modèle que nous choisissons.

  • Le processus précédent ajouté à une fonction déterministe produit un processus qui est spatialement dépendant et hétérogène.

Processus hétérogène dépendant

Cette image montre une réalisation différente de la composante aléatoire de ce processus que celle utilisée pour l'illustration précédente, de sorte que les modèles de petites ondulations ne seront pas exactement les mêmes qu'auparavant - mais ils auront les mêmes propriétés statistiques.

whuber
la source
1
Réponse étonnante, comme d'habitude - exemples très clairs.
Matt Parker
Réponse étonnante, en effet. Une petite question / commentaire supplémentaire: s'il existe une tendance dans les données (hétérogénéité spatiale), il existe des zones où les observations rapprochées sont similaires / ont la même moyenne. Il ne s'ensuit pas que ces observations sont spatialement dépendantes, au moins dans un sens informel?
Funkwecker
1
@Julian Oui, c'est tout à fait ça. C'est pourquoi la forme sous-jacente du processus ne peut pas être identifiée de manière unique à partir d'un examen des seules données. Pour plus de détails, voir ma réponse sur stats.stackexchange.com/a/35524 dans laquelle votre conclusion est étayée par un calcul formel.
whuber
1
@Julian C'est vrai. C'est en partie une question d'échelle: à grande échelle (s'étendant au-delà de la dernière image), on pourrait choisir de modéliser toutes les variations comme aléatoires, avec des corrélations à longue distance; mais à l'échelle indiquée, le meilleur choix pourrait être de modéliser la variation "laïque" à plus longue portée comme une tendance déterministe. Il n'y a pas assez d'informations à l'échelle de l'image pour décider quel est le meilleur modèle, mais il n'y a pas vraiment assez d'informations pour construire un modèle entièrement aléatoire. D'autres informations (non présentes dans les données) peuvent souvent aider à choisir le modèle approprié.
whuber
1
@Julian Le concept pertinent est la stationnarité: dans un processus stationnaire, certaines des caractéristiques des variables aléatoires utilisées dans le modèle ne changent pas avec l'emplacement. La forme la plus élémentaire de stationnarité est lorsque les attentes des variables ne varient pas. De toute évidence, aucune tendance ne produit un modèle stationnaire. Ce n'est pas aussi problématique que vous pourriez le penser, car vous pouvez généralement soustraire la tendance des données et essayer d'utiliser un modèle stationnaire pour les différences. GWR s'en occupera automatiquement si vous incluez lat et lon parmi les variables explicatives.
whuber
0

La notion d'hétérogénéité spatiale dans les statistiques spatiales actuelles n'est utilisée que pour caractériser la variance locale de la dépendance ou de la régression spatiale. J'ai suggéré une large perspective sur l'hétérogénéité spatiale, qui se réfère au modèle de mise à l'échelle de beaucoup plus de petites choses que de grandes. Il est important de noter que le modèle de mise à l'échelle se reproduit plusieurs fois, mesuré par l'indice ht.

https://www.researchgate.net/publication/236627484_Ht-Index_for_Quantifying_the_Fractal_or_Scaling_Structure_of_Geographic_Features

Selon la nouvelle définition, l'hétérogénéité spatiale devrait être formulée comme une loi d'échelle. Ainsi, l'hétérogénéité est similaire à la loi de puissance plutôt qu'à la distribution gaussienne.

Avec cette perspective large, la dépendance spatiale et l'hétérogénéité dépeignent la véritable image de la surface de la Terre. Il y a beaucoup plus de petites choses que de grandes à toutes les échelles ou dans le monde, mais les choses sont plus ou moins similaires à une échelle ou localement; voir cet article pour plus de détails.

https://www.researchgate.net/publication/282310447_A_Fractal_Perspective_on_Scale_in_Geography

Bin Jiang
la source
1
Je pense que ce poste gagnerait à faire une comparaison plus explicite (en notant en particulier toute distinction) entre l'hétérogénéité et la dépendance. La question demandait quelle était la différence entre les deux. Je peux voir que "la dépendance spatiale et l'hétérogénéité dépeignent une véritable image de la surface de la Terre" note une similitude entre les concepts, mais quelle est la distinction entre eux? Représentent-ils cette image de différentes manières?
Silverfish
Il y a une grande différence entre les deux dans la nouvelle définition de l'hétérogénéité, mais peu de différence entre les deux dans l'ancienne définition de l'hétérogénéité. Dans l'ancienne définition, l'hétérogénéité spatiale se réfère à la façon dont la dépendance ou la régression spatiale varie d'un endroit à l'autre. Sous la nouvelle définition de l'hétérogénéité (qui est essentiellement la même définition que dans d'autres sciences telles que la biologie et la physique), l'hétérogénéité spatiale est formulée comme une loi d'échelle universelle et générale. Je pense que la distinction n'est pas seulement technique, mais au niveau du paradigme.
Bin Jiang
Merci. Je pense que la réponse gagnerait à inclure une partie de cette discussion (il y a un bouton d'édition en bas). J'apprécie que cela puisse être traité dans les articles liés, mais nous aimons que nos réponses soient autonomes plutôt que de s'appuyer sur des liens externes.
Silverfish
0

La question dépend de la définition mathématique des deux concepts. Il existe déjà plusieurs définitions de l'autocorrélation spatiale comme le I de Moran, mais peu d'hétérogénéité spatiale, probablement parce que cette dernière dépend de l'échelle et serait différente à des échelles distinctes. J'ai défini l'hétérogénéité stratifiée spatiale (l'article complet est attendu en ligne le 12 mars 2016 dans la revue Ecological Indicators):

Une mesure de l'hétérogénéité stratifiée spatiale

Jin-Feng Wang1 *, Tong-Lin Zhang2, Bo-Jie Fu3

ABSTRAIT

L'hétérogénéité stratifiée spatiale, se référant à la variance intra-strates inférieure à la variance entre strates, est omniprésente dans les phénomènes écologiques, tels que les zones écologiques et de nombreuses variables écologiques. L'hétérogénéité stratifiée spatiale reflète l'essence de la nature, implique des mécanismes distincts potentiels par strates, suggère des déterminants possibles du processus observé, permet la représentativité des observations de la terre et renforce l'applicabilité des inférences statistiques. Dans cet article, nous proposons une méthode statistique q pour mesurer le degré d'hétérogénéité stratifiée spatiale et pour tester sa signification. La valeur q est comprise entre [0, 1] (0 si une stratification spatiale de l'hétérogénéité n'est pas significative, et 1 s'il y a une stratification spatiale parfaite de l'hétérogénéité). La fonction de densité de probabilité exacte est dérivée. La statistique q est illustrée par deux exemples, dans lesquels nous évaluons les hétérogénéités stratifiées spatiales d'une carte manuelle et la distribution du NDVI annuel en Chine. --Jinfeng Wang 2016-3-8

user107803
la source