Outils de statistiques spatiales: analyse de clustering sur des données raster

9

J'ai un problème apparemment simple, mais je ne trouve pas de méthodologie claire à utiliser.

Je suis chargé de délimiter les «zones urbaines» par des polygones convexes vectoriels, en utilisant l' ensemble de données Population quadrillée du monde du CIESIN

Cet ensemble de données fournit des valeurs de densité de population dans le monde entier, sous forme de fichier raster. Le problème est, comme vous l'avez déjà deviné, que les valeurs de densité sont très changeantes, et la définition de «urbain» est assez relative.

J'ai essayé d'utiliser une approche classique et calculé les pentes comme si les valeurs de densité étaient des altitudes, mais les valeurs de pentes étaient également très disparates et spatialement complexes, complexes.

J'ai étudié les algorithmes de clustering spatial, les outils LISA (Local Indocators of Spatial Association), avec ArcGIS et GeoDa, mais je suis assez perdu parmi les outils très spécifiques. Certaines méthodes ne fonctionnent que sur des formes vectorielles, donc une reclassification et une vectorisation sont nécessaires (calcul long).

Pouvez-vous m'aider à affiner l'ensemble des méthodes et outils à utiliser? Merci !

Laurent Jégou
la source
2
Quelle est exactement votre définition de «urbain»? BTW, je ne m'attendrais pas à ce que toutes les zones urbaines soient correctement décrites par des polygones convexes . Beaucoup ont des formes contrôlées par des caractéristiques géographiques - montagnes, rivages et rivières - qui sont très non convexes.
whuber
La définition n'est pas donnée, pas une constante. Je pense que le but est de trouver des zones substantiellement plus denses en ce qui concerne leur environnement, qui varie. Donc, l'idée sur les statistiques spatiales et LISA. Vous avez raison sur la convexité, j'aurais dû écrire "pas d'auto-intersection et pas d'intersection avec d'autres polygones".
Laurent Jégou
En complément, j'ai trouvé tout un module R dédié aux outils d'agglomération spatiale: spdep.
Laurent Jégou

Réponses:

4

J'ai fait un peu de travail à ce sujet pour mon MSc http://ian01.geog.psu.edu/papers/mscthesis.pdf - en gros, j'ai travaillé sur les changements de dégradé mais la discussion peut vous aider avec cela.

Ian Turton
la source
Merci, je vais le lire bientôt, mais c'est prometteur :-)
Laurent Jégou
J'ai essayé la méthode dérivée double Sobel 2 que vous décrivez dans la thèse, sur une zone de test limitée, et c'est très intéressant! Les noyaux urbains clairs sont isolés, malgré des valeurs de densité très différentes. Merci :) Au fait, j'ai utilisé un logiciel gratuit et open source pour calculer les circonvolutions et les calculs matriciels: Opticks.
Laurent Jégou
Une mesure de la lumière artificielle serait un bon indicateur indirect des conditions urbaines. Une recherche Google devrait trouver des exemples d'études.
b_dev
@indiehacker - J'ai regardé ça mais c'est culturellement dépendant, la France par exemple est beaucoup plus sombre que le Royaume-Uni.
Ian Turton
6

Du point de vue de la densité de population, une «zone urbaine» ne devrait généralement satisfaire que quelques critères axiomatiques :

  1. Sa limite ne doit comprendre aucun point de densité (relativement) élevée par rapport à la densité maximale à l'intérieur de celui-ci.

  2. Il doit être simplement connecté (pas de "trous").

  3. Sa densité de population moyenne devrait dépasser un certain seuil prédéfini.

L'axiome (1) est le plus naturel: si un point limite devait avoir une densité élevée, nous déplacerions simplement la limite vers l'extérieur pour inclure ce point dans la zone urbaine. Je voudrais suggérer que «relatif» signifie en proportion du maximum , comme un dixième ou un centième ou autre. Axiom (2) évite d'exclure les parcs et autres régions à faible densité qui se trouvent naturellement dans les villes. L'axiome (3) , qui parce qu'il dépend d'un seuil est quelque peu arbitraire, élimine les petits villages compacts.

En fait, il existe au moins un autre élément d'arbitraire: toute carte quadrillée de la densité de population fait implicitement la moyenne des populations sur les quartiers locaux (égale à une cellule dans certains cas et égale à un rayon de noyau pour les estimations de densité de noyau). Acceptons cette taille de voisinage implicite (qui peut être modifiée en exécutant d'abord des moyens focaux ou d'autres lissages de noyau sur la carte de densité d'origine), ce seuil de population et le sens de «relativement élevé» dans l'axiome 1 comme paramètres réglables par l' utilisateur qui contrôlent la résultat.

Ces axiomes conduisent naturellement à un algorithme assez simple : il faut localiser les maxima locaux, regarder dans leur voisinage jusqu'à ce qu'une limite soit trouvée pour satisfaire l'axiome (1), remplir tous les trous pour satisfaire l'axiome (2), puis filtrer toutes ces zones candidates selon (3). Cela se fait comme suit:

  1. Facultativement, lissez la carte de densité.

  2. Exécutez un algorithme de «remplissage» sur une carte liée à la densité (voir ci-dessous).

  3. RegionGroup le résultat.

  4. Supprimez les trous des polygones RegionGrouped.

  5. Effectuez des sommes zonales de la densité de population sur les polygones remplis.

  6. Éliminez tous les polygones dont les sommes (ou densités moyennes) sont inférieures au seuil de population (densité).

Ce qui reste est votre solution.

Permettez-moi d'en dire un peu plus sur l'étape (1), qui est la clé. Un algorithme de remplissage identifie les «puits» et les «remplit» jusqu'à une quantité constante au-dessus de leurs élévations. C'est exactement ce que nous demande Axiom (1), à condition (a) que nous puissions faire "couler" jouer le rôle de "maximum local" et (b) faire "montant constant au-dessus" jouer le rôle de " fraction constante de. " Pour ce faire, remplissez le logarithme négatif de la densitéplutôt que la densité elle-même. (Ajoutez d'abord une toute petite constante à la densité - disons, environ 0,1 personne par kilomètre carré - avant de prendre le journal, afin que les cellules contenant des zéros ne causent pas de problèmes.) Les "lacs" dans la densité de journal négative identifient le candidat zones urbaines. Vous avez encore trois paramètres indépendants avec lesquels jouer (entrée aux étapes 0, 1 et 5); les définir nécessitera une réflexion sur ce que vous entendez vraiment par «zone urbaine» ainsi qu'une certaine expérimentation.

whuber
la source
Merci pour votre réponse détaillée. J'essaierai de trouver les bons outils logiciels (ou de les programmer) pour tester l'algorithme de remplissage avec le journal négatif, cela semble une bonne piste.
Laurent Jégou