Comment regrouper des points en fonction d'une densité de noyau?

10

J'ai un grand ensemble de données avec 36k points représentant les utilisations commerciales des terres, chacune avec un champ contenant la superficie en pieds carrés. J'ai effectué une analyse de la densité du noyau sur cet ensemble de données, produisant un raster montrant la densité de la superficie commerciale sur toute la zone métropolitaine. J'ai besoin de diviser ce raster en régions correspondant aux maxima locaux, que j'appelle un "centre". J'ai déjà déterminé l'emplacement des centres, et maintenant je dois faire l'une des deux choses suivantes:

  • utilisez un outil de regroupement de points, tel que le "partitionnement autour des médoïdes", pour regrouper les points en grappes autour des centres que j'ai identifiés. Le problème avec cette méthode est qu'elle est intense sur le plan des calculs, et plus encore si j'essaie d'utiliser une matrice de dissimilarité pour pondérer les points par taille.

  • diviser en quelque sorte le raster de densité du noyau (qui ressemble grosso modo à un raster de terrain) en "collines" individuelles autour de chaque centre. Mais je ne peux penser à aucun outil pour le faire.

Ce problème me tourmente depuis un moment et j'espérais pouvoir exécuter la méthode de clustering dans R, mais cela prend du temps et je manque de temps. Quelqu'un connaît-il une méthode simple pour diviser les rasters de densité en quartiers d'intensité ou pour regrouper rapidement de grands ensembles de données?

Patrick
la source
1
Cette question est étroitement liée: stats.stackexchange.com/questions/13995/…
whuber
1
Et aussi posté par moi, comme il se trouve.
Patrick
ce serait 1 pt pour Patrick, je pense ...
BWill

Réponses:

6

Discussion suite à un poste étroitement lié a révélé une solution simple et efficace : trouver les « collines », tourner la grille à l' envers (en niant ses valeurs) et de trouver des bassins versants. Les collines sont des puits et les limites des bassins versants divisent la grille en ces puits.

whuber
la source
Cette solution est simple, rapide et exactement ce que je cherchais. Merci.
Patrick
3

La réponse la plus simple serait d'utiliser un seuil pour masquer les zones qui tombent en dessous du seuil. Cela devrait vous donner des zones distinctes autour de vos centres. Ensuite, il devrait être capable de convertir ces zones en formes.

Vous pouvez également trouver des outils de statistiques spatiales: l'analyse de clustering sur des données raster une discussion utile d'un problème similaire.

Ian Turton
la source
Oui, c'est une discussion très pertinente! Je lis votre thèse de maîtrise et j'essaierai certaines des méthodes.
Patrick
2
L'utilisation d'un seuil ne fonctionnera probablement pas ici, car j'essaie de distinguer les centres des autres centres immédiatement adjacents. Au cœur de la ville, la frontière entre les deux aura une densité très élevée, mais dans la périphérie suburbaine, elle aura une densité très faible. Mais j'espère que l'utilisation du second dérivé sera efficace.
Patrick
3

Je pense que vous devriez revenir à votre problème initial: trouver des grappes de mètres carrés commerciaux dans toute une région métropolitaine.

Je suppose que vos points sont des centroïdes de parcelles avec des valeurs commerciales en pieds carrés? Je suppose que vous pouvez également avoir une couche polygonale de parcelles avec une superficie totale de chaque parcelle? Cela vous donne un ensemble de cas (les centroïdes) et une population (les polygones de parcelles) pour les mètres carrés commerciaux et les mètres carrés respectivement.

Allez chercher SatScan http://www.satscan.org/ et exécutez un modèle distribué uniquement par Poisson et vous aurez vos grappes de pieds carrés commerciaux dans un ordre assez rapide. (Vous pouvez également utiliser des pieds carrés de terrain comme population plutôt que des mètres carrés d'espace de construction. Cela pourrait même être la meilleure population.)

blord-castillo
la source
Vous avez raison de dire que les points sont des centroïdes, mais malheureusement, l'ensemble de données a été compilé par d'autres à partir de la couche parcellaire de chaque comté et distribué uniquement sous forme de points. Mais SatScan ressemble à un logiciel très utile, donc je garderai cela à l'esprit pour d'autres applications.
Patrick