Je voudrais tracer les données par zone suivantes (30 zones au total) sur une carte imprimable / non interactive:
- Âge moyen
- Revenu moyen du ménage
- Nombre de ménages
- Densité de population
- Nombre de personnes
- Nombre de travailleurs
Comment afficheriez-vous efficacement les 6 couches ci-dessus sur une carte?
cartography
visualisation
dassouki
la source
la source
Réponses:
Je dirais que vous ne pouvez pas inclure toutes ces données sur une carte et que cela ait un sens. Je vous recommande de penser dans le sens du principe de Tufte de petits multiples, ayant plusieurs petites cartes de la même zone, chacune utilisant une variable différente. Exemple: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/
Même dans ce cas, vous avez le problème d'utiliser un tas d'unités différentes, vous avez donc besoin d'un tas de clés. Une autre façon de visualiser les données (mais pas sur une carte) serait d'utiliser un tableau avec toutes les valeurs, colorées (c'est-à-dire - différentes couleurs pour en dessous de la moyenne, moyenne, au-dessus de la moyenne)
Je vous recommande également de consulter l'atlas du recensement pour plus d'idées de cartes: http://www.census.gov/population/www/cen2000/censusatlas/
Pourrait aider à réfléchir davantage sur le message que vous essayez de communiquer, exactement (pas seulement sur les données que vous avez).
la source
Il n'est pas possible d'afficher efficacement autant de données sur une seule carte. Deux possibilités:
Produire 6 cartes,
Analysez vos données pour classer vos régions et afficher le résultat de la classification. Une analyse en composantes principales peut aider à déterminer les corrélations les plus importantes au sein de votre variable. Cette méthode a été utilisée pour produire cette carte synthétique:
parmi ceux-ci:
la source
Je suis d'accord que les petits multiples sont probablement un bon moyen d'aborder ce problème. Pour compléter la carte, je suggérerais également une matrice de nuage de points de vos variables, qui identifierait les corrélations bivariées. Alors que vous perdez l'aspect géographique de vos données, il est beaucoup plus simple de visualiser les relations entre les variables dans un nuage de points que de comparer deux cartes (même côte à côte).
Si vous souhaitez toujours capturer une sorte de tendances spatiales, vous pouvez inclure des statistiques spatiales (comme le I de Moran local) entre les distributions et / ou les variables d'origine.
Edit: J'ai rencontré récemment des travaux revisitant les statistiques morales publiées par André-Michel Guerry (à l'origine en 1883) qui ont pour objectif de visualiser les relations multi-variées dans l'espace. Les implémentations de ces auteurs sont très similaires à ce qui a été suggéré dans ce fil, les petits multiples, l'analyse des composants principaux, les matrices de nuage de points et dans les diagrammes polygonaux. Ci-joint quelques photos de A.-M. Statistiques morales de Guerry en France: défis pour l'analyse spatiale multivariable par: Michael Friendly Statistical Science, Vol. 22, no 3. (août 2007), pp. 368-399 (le PDF est gratuit). Un autre article ( Dray et Jombart, 2010 ) analyse également les mêmes données et contient du code source en R pour réaliser ces tracés.
Une image est une matrice de nuage de points, l'autre est ce qu'on appelle un diagramme en étoile (ce qui est juste une façon différente de représenter des graphiques à barres comme Pablo l'a suggéré).
la source
Voici un merveilleux exemple de petits multiples publiés sur la modélisation statistique, l'inférence causale et les sciences sociales d' Andrew Gelman (et le blog de l'entreprise) . La carte montre le soutien des électeurs aux bons scolaires par État, sous réserve du revenu et des différentes catégories raciales et religieuses. Les non-évangéliques blancs n'aiment vraiment pas les bons scolaires! (Si vous allez sur le blog même si cela apparaît dans les données de l'enquête de 2004, c'est plus de soutien pour les bons scolaires parmi ce groupe).
la source
Pour choisir entre les solutions présentées ici, vous pouvez fournir deux informations clés:
Les solutions citées ici peuvent avoir une efficacité différente selon le but et le public.
Je voudrais généraliser la réponse de Julien (une carte synthétique à l'aide d'un PCA) en citant la technique de la diagonalisation matricielle, décrite par J. Bertin. C'est utile quand on cherche un résumé de toutes les informations, plutôt qu'une présentation complète des données.
En résumé, cela consiste à représenter chaque variable avec un histogramme, à trier une pile les histogrammes de manière à ce que les valeurs (les zones de la carte) soient alignées en diagonale, pour obtenir une typologie:
(Source: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )
la source
C'est beaucoup d'informations et c'est un fait qu'une seule carte les combinant de manière thématique entraînerait une présentation inutile à cause de la pollution visuelle. En revanche, il y a 30 zones, donc de nombreuses cartes pour chaque zone entraîneraient également de la pollution.
Ma solution: choisissez laquelle est l'information la plus importante, disons «revenu du ménage», puis zonez la carte dans certaines catégories de revenus. Et enfin, pour chaque point de revenu, tracez une discussion avec les 5 autres attributs.
Avec cette carte peut faire des comparaisons comme, par exemple: "Les zones à revenu élevé montrent toujours un grand nombre de travailleurs et un âge moyen de plus de 21 ans".
Regardez l'exemple...
la source
Peut-être que certaines de ces idées pourraient aider?
En supposant que vous ayez six dimensions:
1: Choroplèth : exemple de revenu du ménage 0
2, 3 et 4: Symboles : représentant le nombre de personnes sous forme de points, ce qui peut vous permettre de voir l'arrière-plan: exemple 1, exemple 2 utilisant des niveaux de gris pour les travailleurs / non-travailleurs et un jeu de couleurs différent pour montrer l'âge
5: 3D : Utilisation de la densité de population comme exemple de terrain 3
6: (Je ne peux pas penser à une 6ème voie!)
Est-il redondant d'afficher «Nombre de ménages», «Densité de population» et «Nombre de personnes»?
Je serais sceptique si une carte avec cette complexité était claire pour quiconque en dehors de vous. Si je le présentais, je montrerais d'abord chaque élément séparément, puis je l'ajouterais pour que le public puisse comprendre les étapes.
Une autre façon (si vous n'avez pas de place pour un graphique radar pour chaque zone, pourrait être de créer un «glyphe» représentant cette information exemple 4, fig 10.28 . Je pense que ceux-ci sont généralement difficiles à comprendre et pas faciles à concevoir clairement, mais l'exemple lié pourrait être utilisé dans ce cas.
Une autre pensée que j'avais, serait d'extruder les polygones à la même hauteur pour chaque polygone, puis d'utiliser une section de la hauteur pour représenter ces paramètres. Similaire à la création d'un graphique à barres pour chaque zone, mais où chaque section est superposée à des intervalles similaires. Cela devrait être vu à partir de la 3D, ce qui signifierait qu'une partie serait obscurcie.
la source
C'est une tâche difficile. Ma réponse est d'aller avec une carte multivariée. Consultez cette carte . La carte semblera occupée si vous affichez toutes les variables sur une seule carte. Assurez-vous de sélectionner le jeu de couleurs approprié si vous choisissez d'utiliser une carte multivariée.
la source
Un degré de simplification consisterait à exprimer un élément, tel que la densité de la population, à travers un cartogramme, c'est-à-dire à déformer la superficie de chaque unité afin qu'elle soit proportionnelle à la population:
(source: amherst.edu )
Le principal inconvénient est que le spectateur doit être capable de reconnaître la distorsion des zones à partir de leurs formes "habituelles".
Plus d'informations ici: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf
la source