J'essaie de déterminer si la présence d'un grand nombre de militaires en service actif dans une zone est spatialement corrélée avec des niveaux plus ou moins élevés de crimes violents. Autrement dit, les zones entourant les grandes bases militaires sont-elles plus / moins violentes, en moyenne, que les zones qui ne sont pas à proximité de bases militaires?
Je travaille avec les deux jeux de données suivants:
(1) un ensemble de données ponctuelles sur les bases militaires des États-Unis continentaux et leurs niveaux de troupes correspondants:
(2) un ensemble de données nationales sur les taux de crimes violents par ville:
J'ai l'impression de chercher une sorte de modèle basé sur la gravité où la fonction "masse" donne des niveaux de troupes à chaque base. Ainsi, une grande présence de troupes exercerait une influence sur une plus grande zone et aurait un effet plus fort près du centre de masse (c'est-à-dire l'emplacement du point dans la couche SIG).
Je pense que, conceptuellement, cela ressemblerait à ceci:
Dans ce diagramme, X, Y, Z représentent des bases militaires. a, b, c, d représentent chacun des villes (chacune ayant un champ de taux de violence dans sa table attributaire).
Le gradient autour des bases représente le champ d'influence, qui diminue exponentiellement avec la distance du centre de gravité de la base. Une plus grande présence de troupes équivaut à un plus grand rayon d'influence (avec une certaine distance de seuil maximale), et également à une influence plus forte à proximité du centre par rapport aux zones proches d'une base plus petite.
Chaque ville se verra attribuer un score basé sur la somme de l’amplitude de tous les vecteurs de «force» de toutes les bases environnantes dont ils dépendent. Ainsi, dans mon diagramme, la ville a aurait un score de 0 car elle se trouve en dehors du rayon de toute base. Ville b ne serait influencée par la base X . Ville c ne serait influencée par la base Z , et son score serait inférieur à b , puisque X est une base beaucoup plus grande que Z . Enfin, la ville d se situe dans le rayon des deux bases X et Y, il recevrait un score basé sur la somme de l'ampleur de l'influence des deux bases. Je verrais alors s'il existe une corrélation entre un score plus élevé pour une ville et des taux de violence plus élevés.
J'ai étudié divers modèles basés sur la gravité (modèles Huff , etc.) mais je n'ai pas pu trouver grand-chose jusqu'à QGIS / Python, et je ne sais pas trop comment mettre en œuvre ce que j'ai décrit ci-dessus ... Quelqu'un a-t-il des suggestions pour ça? Avez-vous déjà effectué ce type d'analyse dans d'autres domaines?
Le TLDR est donc:
- Quelles techniques statistiques pourrais-je utiliser pour ce genre de question?
- Y a-t-il des outils intégrés à QGIS (ou disponibles en tant que plugins) qui peuvent le faire?
- S'il n'y a rien de tel dans QGIS, y a-t-il des bibliothèques Python qui peuvent effectuer ce type d'analyse?
la source
Réponses:
Développer mon commentaire ci-dessus
Ce que vous allez probablement finir par vouloir faire, c'est exécuter une régression linéaire avec décalage spatial, ce qui explique la corrélation spatiale de certaines de vos variables (je vais devoir regarder mes notes à ce sujet).
Luc Anselin a été un pionnier dans cet espace, et vous devriez jeter un œil à son travail, en particulier les outils et la documentation (gratuits) du GeoDa Center . Ces deux outils pourraient vous intéresser:
Ma recherche d'un plugin PySAL pour QGIS a trouvé quelque chose qui n'a pas été mis à jour depuis des années, mais vous pourriez avoir plus de chance.
la source