Affichage efficace des données démographiques sur une carte imprimée

29

Je voudrais tracer les données par zone suivantes (30 zones au total) sur une carte imprimable / non interactive:

  • Âge moyen
  • Revenu moyen du ménage
  • Nombre de ménages
  • Densité de population
  • Nombre de personnes
  • Nombre de travailleurs

Comment afficheriez-vous efficacement les 6 couches ci-dessus sur une carte?

dassouki
la source
1
Quelle est la taille des zones par rapport à la taille de la page? Pouvez-vous adapter un petit terrain dans chaque zone? (par exemple une carte radar)
djq
@celenius -Il s'agit d'un type d'enquête de recensement typique, où les zones du centre-ville sont beaucoup plus petites que les zones résidentielles qui sont nettement plus petites que les zones suburbaines / rurales
dassouki
1
Ces 6 couches sur une carte statique sont un travail de conception difficile. Quel est le problème empêchant l'utilisation d'une carte interactive?
Trevesy
@Trevesy - pour la plupart, l'exigence est de concevoir une carte imprimable qui met en évidence les 6 variables pour promouvoir l'analyse visuelle
dassouki
1
J'ai pris la liberté d'ajouter la balise de visualisation, n'hésitez pas à la supprimer si vous pensez qu'elle est inappropriée.
Andy W

Réponses:

20

Je dirais que vous ne pouvez pas inclure toutes ces données sur une carte et que cela ait un sens. Je vous recommande de penser dans le sens du principe de Tufte de petits multiples, ayant plusieurs petites cartes de la même zone, chacune utilisant une variable différente. Exemple: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

Même dans ce cas, vous avez le problème d'utiliser un tas d'unités différentes, vous avez donc besoin d'un tas de clés. Une autre façon de visualiser les données (mais pas sur une carte) serait d'utiliser un tableau avec toutes les valeurs, colorées (c'est-à-dire - différentes couleurs pour en dessous de la moyenne, moyenne, au-dessus de la moyenne)

Je vous recommande également de consulter l'atlas du recensement pour plus d'idées de cartes: http://www.census.gov/population/www/cen2000/censusatlas/

Pourrait aider à réfléchir davantage sur le message que vous essayez de communiquer, exactement (pas seulement sur les données que vous avez).

neuhausr
la source
5
+1 C'est bien mieux que de faire un gâchis en essayant de symboliser six variables à la fois. De plus, pourquoi ne pas imprimer un tableau des données? Six colonnes + id, 30 lignes: elle est suffisamment petite et donne tous les détails dont tout le monde aurait besoin.
whuber
13

Il n'est pas possible d'afficher efficacement autant de données sur une seule carte. Deux possibilités:

  • Produire 6 cartes,

  • Analysez vos données pour classer vos régions et afficher le résultat de la classification. Une analyse en composantes principales peut aider à déterminer les corrélations les plus importantes au sein de votre variable. Cette méthode a été utilisée pour produire cette carte synthétique:

texte alternatif

parmi ceux-ci:

texte alternatif texte alternatif

julien
la source
Le problème d'avoir 6 cartes est qu'il est difficile de déterminer visuellement les tendances. Parfois, il est agréable de regarder une carte avec plusieurs variables et de voir comment les choses s'alignent
dassouki
2
@dassouki, pour voir comment les choses s'alignent, vous n'avez pas nécessairement besoin de les cartographier. Les diagrammes de dispersion bivariés répondraient à ces critères et seraient beaucoup plus faciles à interpréter.
Andy W
3
L' avantage d'avoir 6 cartes est qu'il est facile d'identifier visuellement les tendances! Lorsque vous essayez de regrouper six variables (ou plus) en une seule carte, il peut devenir difficile de trouver des modèles. (Si cette carte impliquait des milliers d'entités, je changerais cependant cette remarque: certains types de cartographie, tels que la visualisation de glyphes , peuvent être remarquablement efficaces pour trouver des modèles dans des ensembles de données richement multivariés: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber
@julien, Cool stuff, vous pouvez être intéressé par cet article que je viens de rencontrer, e-publications.org/ims/submission/index.php/AOAS/user/… , il a des cartes avec l'analyse PCA associée de multi-varié similaire données ainsi que le code R pour faire les parcelles.
Andy W
Vraiment intéressant, je vais devoir lire à ce sujet.
neuhausr
9

Je suis d'accord que les petits multiples sont probablement un bon moyen d'aborder ce problème. Pour compléter la carte, je suggérerais également une matrice de nuage de points de vos variables, qui identifierait les corrélations bivariées. Alors que vous perdez l'aspect géographique de vos données, il est beaucoup plus simple de visualiser les relations entre les variables dans un nuage de points que de comparer deux cartes (même côte à côte).

Si vous souhaitez toujours capturer une sorte de tendances spatiales, vous pouvez inclure des statistiques spatiales (comme le I de Moran local) entre les distributions et / ou les variables d'origine.

Edit: J'ai rencontré récemment des travaux revisitant les statistiques morales publiées par André-Michel Guerry (à l'origine en 1883) qui ont pour objectif de visualiser les relations multi-variées dans l'espace. Les implémentations de ces auteurs sont très similaires à ce qui a été suggéré dans ce fil, les petits multiples, l'analyse des composants principaux, les matrices de nuage de points et dans les diagrammes polygonaux. Ci-joint quelques photos de A.-M. Statistiques morales de Guerry en France: défis pour l'analyse spatiale multivariable par: Michael Friendly Statistical Science, Vol. 22, no 3. (août 2007), pp. 368-399 (le PDF est gratuit). Un autre article ( Dray et Jombart, 2010 ) analyse également les mêmes données et contient du code source en R pour réaliser ces tracés.

Une image est une matrice de nuage de points, l'autre est ce qu'on appelle un diagramme en étoile (ce qui est juste une façon différente de représenter des graphiques à barres comme Pablo l'a suggéré). texte alternatif texte alternatif

Andy W
la source
8

Voici un merveilleux exemple de petits multiples publiés sur la modélisation statistique, l'inférence causale et les sciences sociales d' Andrew Gelman (et le blog de l'entreprise) . La carte montre le soutien des électeurs aux bons scolaires par État, sous réserve du revenu et des différentes catégories raciales et religieuses. Les non-évangéliques blancs n'aiment vraiment pas les bons scolaires! (Si vous allez sur le blog même si cela apparaît dans les données de l'enquête de 2004, c'est plus de soutien pour les bons scolaires parmi ce groupe). entrez la description de l'image ici

Andy W
la source
Le graphique est cool, mais l'échelle des couleurs est horrible. Pourquoi 50% est-il si prioritaire, en le rendant gris? Certes, il devrait simplement utiliser des couleurs de carte thermique, ou quelque chose? Aussi, pourquoi seulement les gens sont-ils divisés en religion? il serait sûrement plus logique de se diviser par race, puis par religion?
naught101
@ naught101, je suis un peu confus par votre négativité. Il est certain que le gris est désaccentué par rapport aux couleurs plus claires ou plus sombres à chaque extrémité du spectre. Bien que je sois abivalent au sujet de la divergence arbitraire à 45%, l'OMI lors de la création de petites cartes multiples comme celles-ci, il est bénéfique d'avoir des valeurs très contrastées. Le commentaire sur les divisions religion / race n'a pas beaucoup de sens non plus. Ce sont des catégories qui sont évidemment très liées à la prise en charge des bons par un individu, et il semble que certains des sous-ensembles que vous suggérez n'existent pas. suite ...
Andy W
IE Je doute fortement qu'il y ait suffisamment de "catholiques noirs" dans l'enquête pour dire quoi que ce soit de substantiel à propos d'un tel groupe (ni "Hispanic Non-Evang Protestants). Je vous suggère de lire l'article de Gelman et j'espère que cela éclaircira la motivation pour les sous-groupes.
Andy W
c'est peut-être juste que des gris particuliers ressortent sur mon écran. Je pense que ce serait mieux avec du blanc, et peut-être un fond gris pour le distinguer. Il convient également de noter que les deux images sur le blog de Gelman ont des échelles différentes ... J'avais l'impression que la population noire était beaucoup plus élevée, mais je viens de regarder les données du recensement et de me corriger. Une chose étrange cependant, c'est que le recensement définit l'origine hispanique comme orthogonale à la race (c'est une question distincte). Je suppose que les distinctions de Gelman sont définies différemment ..
naught101
@ naught101 ce n'est pas une information du recensement, c'est d'une autre enquête (le recensement n'a rien d'opinion publique à ce sujet)
Andy W
5

Pour choisir entre les solutions présentées ici, vous pouvez fournir deux informations clés:

  • quel est le but de la carte? (Découvrir, exposer?)
  • quel est le public cible de la carte? (Vous, collègues analystes, urbaniste, public?)

Les solutions citées ici peuvent avoir une efficacité différente selon le but et le public.

Je voudrais généraliser la réponse de Julien (une carte synthétique à l'aide d'un PCA) en citant la technique de la diagonalisation matricielle, décrite par J. Bertin. C'est utile quand on cherche un résumé de toutes les informations, plutôt qu'une présentation complète des données.

En résumé, cela consiste à représenter chaque variable avec un histogramme, à trier une pile les histogrammes de manière à ce que les valeurs (les zones de la carte) soient alignées en diagonale, pour obtenir une typologie:

texte alternatif

(Source: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_similarbooks )

Laurent Jégou
la source
4

C'est beaucoup d'informations et c'est un fait qu'une seule carte les combinant de manière thématique entraînerait une présentation inutile à cause de la pollution visuelle. En revanche, il y a 30 zones, donc de nombreuses cartes pour chaque zone entraîneraient également de la pollution.

Ma solution: choisissez laquelle est l'information la plus importante, disons «revenu du ménage», puis zonez la carte dans certaines catégories de revenus. Et enfin, pour chaque point de revenu, tracez une discussion avec les 5 autres attributs.

Avec cette carte peut faire des comparaisons comme, par exemple: "Les zones à revenu élevé montrent toujours un grand nombre de travailleurs et un âge moyen de plus de 21 ans".

Regardez l'exemple...

texte alternatif

Pablo
la source
4

Peut-être que certaines de ces idées pourraient aider?

En supposant que vous ayez six dimensions:

1: Choroplèth : exemple de revenu du ménage 0

2, 3 et 4: Symboles : représentant le nombre de personnes sous forme de points, ce qui peut vous permettre de voir l'arrière-plan: exemple 1, exemple 2 utilisant des niveaux de gris pour les travailleurs / non-travailleurs et un jeu de couleurs différent pour montrer l'âge

5: 3D : Utilisation de la densité de population comme exemple de terrain 3

6: (Je ne peux pas penser à une 6ème voie!)

Est-il redondant d'afficher «Nombre de ménages», «Densité de population» et «Nombre de personnes»?

Je serais sceptique si une carte avec cette complexité était claire pour quiconque en dehors de vous. Si je le présentais, je montrerais d'abord chaque élément séparément, puis je l'ajouterais pour que le public puisse comprendre les étapes.


Une autre façon (si vous n'avez pas de place pour un graphique radar pour chaque zone, pourrait être de créer un «glyphe» représentant cette information exemple 4, fig 10.28 . Je pense que ceux-ci sont généralement difficiles à comprendre et pas faciles à concevoir clairement, mais l'exemple lié pourrait être utilisé dans ce cas.


Une autre pensée que j'avais, serait d'extruder les polygones à la même hauteur pour chaque polygone, puis d'utiliser une section de la hauteur pour représenter ces paramètres. Similaire à la création d'un graphique à barres pour chaque zone, mais où chaque section est superposée à des intervalles similaires. Cela devrait être vu à partir de la 3D, ce qui signifierait qu'une partie serait obscurcie.

djq
la source
J'adore et je veux dire toutes vos suggestions. Je prévois de mettre en œuvre 1-> 4. Cependant, pour les trucs 3D: je trouve que lorsque vous faites des cartes 3D, les centres-villes, généralement situés au centre, obtiennent la plupart de l'élévation, bloquant beaucoup de zones derrière eux
dassouki
@dassouki - Je suis d'accord que c'est généralement le cas. Vous pourriez peut-être utiliser une variable qui n'a pas de plage énorme pour cela (âge moyen?), Ou si c'est le cas, vous pourriez la transformer logarithmiquement.
djq
3
@celenius Question intéressante sur une éventuelle redondance: la densité de population est le nombre de personnes par rapport à la zone ; le nombre de personnes est un nombre absolu ; et le nombre de ménages donne des informations sur la façon dont les gens vivent ensemble. Bien que ces trois variables soient clairement liées (et peuvent créer des problèmes de quasi-colinéarité dans les régressions), il s'agit en réalité de trois informations différentes. BTW, c'est "choroplèth". (Heureusement, Google reconnaît cette faute de frappe et effectue la recherche prévue de toute façon.)
whuber
1
@whuber - Je pense que c'est probablement fait en utilisant le flash (malheureusement!).
djq
2
Je suis très méfiant à propos de la suggestion de la 3D. AFAIK personne n'a montré que la 3D est très utilisable. Le lien avec le crime de San Fran fonctionne mais seulement parce que c'est très simple - un modèle plus complexe serait difficile à déchiffrer. Je ne pense pas que la 3D soit la voie à suivre dans ce cas.
Trevesy
2

C'est une tâche difficile. Ma réponse est d'aller avec une carte multivariée. Consultez cette carte . La carte semblera occupée si vous affichez toutes les variables sur une seule carte. Assurez-vous de sélectionner le jeu de couleurs approprié si vous choisissez d'utiliser une carte multivariée.

Raj
la source
Google Docs est bloqué là où je travaille :(
dassouki
n'a pas fonctionné non plus et je ne peux pas le gratter s'il n'a pas d'extension de fichier à la fin
dassouki
Toujours pas ...
dassouki
c'est bloc de mon côté. :( Cela ne me dérange pas de vous envoyer la carte par e-mail.
Raj
0

Un degré de simplification consisterait à exprimer un élément, tel que la densité de la population, à travers un cartogramme, c'est-à-dire à déformer la superficie de chaque unité afin qu'elle soit proportionnelle à la population:

Élection présidentielle américaine de 2008
(source: amherst.edu )

Le principal inconvénient est que le spectateur doit être capable de reconnaître la distorsion des zones à partir de leurs formes "habituelles".

Plus d'informations ici: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf

Andy
la source
1
Je pense que cela a du potentiel, mais on ne sait pas dans quelle mesure les cartogrammes peuvent être appliqués à cette situation particulière (affichage simultané de plusieurs attributs sur le même espace). Vous pouvez théoriquement faire de nombreux petits cartogrammes multiples, mais cela peut être difficile à interpréter (vous perdez la cohérence entre les cartes, ce qui est un peu essentiel pour les petits multiples). Peut-être que le cartogramme peut être combiné avec la couleur de manière plus intéressante pour montrer plusieurs attributs.
Andy W
1
Un exemple de petits cartogrammes multiples, gisandscience.com/2011/12/07/…
Andy W