Je ne suis pas du tout bon en statistiques, mais je pense que je suis au bon endroit. Ma question est simple:
Mon problème consiste à comparer la population de plusieurs États dans un petit pays, mais certains États ont une population de 3 000 000 et certains une population de 2 000.
Je le peins sur une carte, et l '"intensité" de la couleur dépend de la façon dont la population de chaque État se compare à la population de tout le pays.
Le problème est que les États très peuplés sont représentés avec des couleurs très intenses et que les petits États n'ont presque aucune couleur.
Existe-t-il un moyen simple de "normaliser" ou de rendre les données comparables?
Je ne sais pas si je m'explique correctement mais j'espère que quelqu'un pourra m'aider. Veuillez commenter si ma question n'est pas claire et je vais clarifier.
Merci de votre aide!
Réponses:
Je suis désolé, mais il me semble que vous essayez de réparer ce qui n'est pas cassé. En fait, vous pourriez même essayer de briser ce qui ne l'est pas. Lorsque vous avez une variable quantitative (ici, population) qui s'étend sur une large plage, la métrique que vous utilisez pour la représenter doit également couvrir une large plage.
Mais pour tout ce qui concerne la couleur (et en particulier les cartes), la source clé est, je pense, ColorBrewer
la source
Bonne question, une solution consiste à redimensionner les couleurs pour les répartir plus uniformément, ou à une distribution avec des queues plus basses ... mais alors votre légende doit être suffisamment claire car déformer l'échelle, d'une manière ou d'une autre, est injuste ...
Par exemple, dans R, le redimensionnement d'une normale en uniforme. (ce que vous avez va peut-être plus dans l'autre sens puisque vous avez de grosses queues et que vous les voulez plus petites, mais le principe est le même)
la source
Vous pourriez diviser par la population totale. Cela garantirait que tout se situe entre 0 et 1. Si les échelles sont encore trop disparates, envisagez une échelle logarithmique.
la source
Je me sens gêné de le demander, mais êtes-vous vraiment déterminé à utiliser la couleur pour représenter une quantité quantitative? N'y a-t-il pas moyen de mettre une barre dans chaque état, dont la hauteur représente la quantité?
Une autre façon pourrait être de montrer la carte avec des zones représentant les zones géographiques, ainsi qu'une carte où la zone de chaque État est proportionnelle à la taille de la population - similaire à la façon dont l' homoncule sensoriel le fait. Mais ce serait une quantité pénible de dessin - je ne connais aucun moyen d'automatiser cela (bien qu'il puisse exister)
la source
Votre objectif déclaré:
Votre problème déclaré:
Objectif de normaliser vos données avant la cartographie
Cette réponse fera défaut car je ne suis pas sûr du contexte de la raison pour laquelle vous faites la carte.
Néanmoins, voici quelques réflexions à explorer: normalisez vos données afin que la carte donne un sens intéressant aux lecteurs potentiels de la carte, afin qu'ils puissent lier ce qu'ils voient sur votre carte à un concept auquel ils pensent normalement. Fondamentalement, je pense que vos nouveaux nombres normalisés devraient être liés à un concept qualitatif que les lecteurs de cartes trouvent intéressant à comprendre (friandise aléatoire: mesure = quantité x qualité, Hegel).
Deux façons de normaliser vos données
1. Afin de donner une idée de la quantité d'espace ouvert dans chaque état.
Créez une nouvelle variable d'état pour la densité de population en calculant la population divisée par la superficie totale de l'État.
2. Afin de faire contraster la coloration des états.
Créez une nouvelle variable d'état en calculant l'écart par rapport à la moyenne de chaque état. Par exemple, supposons que vous ayez 3 États avec des populations comme suit:
La moyenne sera d'environ 50.
Les valeurs de la nouvelle variable pour chaque état seront les suivantes:
Vous pouvez utiliser n'importe quel schéma de couleurs où les nombres positifs contrastent avec les nombres négatifs (google 'colorbrewer' pour de nombreux exemples de schémas de couleurs pour les cartes).
la source