J'ai un grand ensemble de données avec 36k points représentant les utilisations commerciales des terres, chacune avec un champ contenant la superficie en pieds carrés. J'ai effectué une analyse de la densité du noyau sur cet ensemble de données, produisant un raster montrant la densité de la superficie commerciale sur toute la zone métropolitaine. J'ai besoin de diviser ce raster en régions correspondant aux maxima locaux, que j'appelle un "centre". J'ai déjà déterminé l'emplacement des centres, et maintenant je dois faire l'une des deux choses suivantes:
utilisez un outil de regroupement de points, tel que le "partitionnement autour des médoïdes", pour regrouper les points en grappes autour des centres que j'ai identifiés. Le problème avec cette méthode est qu'elle est intense sur le plan des calculs, et plus encore si j'essaie d'utiliser une matrice de dissimilarité pour pondérer les points par taille.
diviser en quelque sorte le raster de densité du noyau (qui ressemble grosso modo à un raster de terrain) en "collines" individuelles autour de chaque centre. Mais je ne peux penser à aucun outil pour le faire.
Ce problème me tourmente depuis un moment et j'espérais pouvoir exécuter la méthode de clustering dans R, mais cela prend du temps et je manque de temps. Quelqu'un connaît-il une méthode simple pour diviser les rasters de densité en quartiers d'intensité ou pour regrouper rapidement de grands ensembles de données?
Réponses:
Discussion suite à un poste étroitement lié a révélé une solution simple et efficace : trouver les « collines », tourner la grille à l' envers (en niant ses valeurs) et de trouver des bassins versants. Les collines sont des puits et les limites des bassins versants divisent la grille en ces puits.
la source
La réponse la plus simple serait d'utiliser un seuil pour masquer les zones qui tombent en dessous du seuil. Cela devrait vous donner des zones distinctes autour de vos centres. Ensuite, il devrait être capable de convertir ces zones en formes.
Vous pouvez également trouver des outils de statistiques spatiales: l'analyse de clustering sur des données raster une discussion utile d'un problème similaire.
la source
Je pense que vous devriez revenir à votre problème initial: trouver des grappes de mètres carrés commerciaux dans toute une région métropolitaine.
Je suppose que vos points sont des centroïdes de parcelles avec des valeurs commerciales en pieds carrés? Je suppose que vous pouvez également avoir une couche polygonale de parcelles avec une superficie totale de chaque parcelle? Cela vous donne un ensemble de cas (les centroïdes) et une population (les polygones de parcelles) pour les mètres carrés commerciaux et les mètres carrés respectivement.
Allez chercher SatScan http://www.satscan.org/ et exécutez un modèle distribué uniquement par Poisson et vous aurez vos grappes de pieds carrés commerciaux dans un ordre assez rapide. (Vous pouvez également utiliser des pieds carrés de terrain comme population plutôt que des mètres carrés d'espace de construction. Cela pourrait même être la meilleure population.)
la source