Des ressources pour apprendre à créer des visualisations de données?

19

Je souhaite apprendre à créer le type de visualisations que vous voyez sur http://flowingdata.com et informationisbeautiful. EDIT: Signification, visualisations qui sont intéressantes en elles-mêmes - un peu comme les graphiques du NY Times, par opposition à quelque chose de rapide pour un rapport.

Quels types d'outils sont utilisés pour les créer - s'agit-il principalement d'Adobe Illustrator / Photoshop? Quelles sont les bonnes ressources (livres, sites Web, etc.) pour apprendre à utiliser ces outils en particulier pour la visualisation des données?

Je sais à quoi je veux que les visualisations ressemblent (et je connais les principes de conception, par exemple, dans les livres de Tufte), mais je n'ai aucune idée de comment les créer.

raegtin
la source

Réponses:

20

Le flux de données discute régulièrement des outils qu'il utilise. Voir, par exemple:

Il montre également en détail comment il crée des graphiques à l'occasion, tels que:

Il y a aussi d'autres questions sur ce site:

OMI, essayez:

  1. R et ggplot2: c'est une bonne vidéo d'introduction , mais le site web ggplot2 a beaucoup de ressources.
  2. Traitement: plein de bons tutoriels sur la page d'accueil .
  3. Protovis: également une pléthore de bons exemples sur la page d'accueil .

Vous pouvez ensuite utiliser Adobe pour les nettoyer.

Vous pouvez également consulter le webvispackage R , bien qu'il ne soit pas aussi complet que ggplot2. Depuis R, vous pouvez exécuter cette commande pour voir l'exemple Playfair's Wheat:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

Enfin, mes applications commerciales préférées pour la visualisation interactive sont:

Shane
la source
1
Des liens géniaux et géniaux! J'utilise déjà R et ggplot2, mais les visualisations à partir de là semblent plus de la variété "graphiques pour un rapport" que de la "variété de bonbons pour les yeux / visualisation intéressante en soi" que je recherche. (ggplot2 est super beau, mais il n'est pas vraiment destiné à permettre une créativité illimitée.) Ai-je tort?, ou utilisez-vous parfois R / ggplot2 comme entrée dans un autre outil de visualisation?
raegtin
5

Le traitement déjà mentionné a un bel ensemble de livres disponibles. Voir: 1 , 2 , 3 , 4 , 5 , 6 , 7

Vous trouverez beaucoup de choses sur le Web pour vous aider à commencer avec R. Comme étape suivante, ggplot2 a une excellente documentation Web . J'ai également trouvé le livre de Hadley très utile.

Python pourrait être une autre façon de procéder. Surtout avec des outils comme:

Tous les projets sont bien documentés sur le web. Vous pourriez également envisager de jeter un œil à certains livres .

Enfin, le livre Graphics of Large Datasets pourrait également être utile.

radek
la source
igraphtravaille également en R; pour 3D openGL accéléré vis dans R, utilisez rgl& misc3dpackages.
Les matplotlibparcelles sont également laides; ils peuvent être bien pour un utilisateur de gnuplot de longues années.
2

Vous passerez beaucoup de temps à vous familiariser avec R.

RapidMiner est gratuit et open source et graphique, et a beaucoup de bonnes visualisations, et vous pouvez les exporter.

Si vous avez de l'argent à perdre, ou si vous êtes un membre du personnel universitaire / étudiant, JMP est également très sympa. Il peut faire de très jolis graphes, très très facilement. Peut exporter au format flash ou PNG ou PDF ou ce que vous avez.

Neil McGuigan
la source
5
1. Le temps passé à mon humble avis avec R est bien investi si vous prévoyez de faire quelque chose de sérieux. 2. Considérez également KNIME knime.org comme alternative à RapidMiner.
radek
(+1) @radek. Je suis également un fan de rapidminer, mais à mon avis, il n'est pas assez flexible pour des visualisations sophistiquées.
steffen
Si vous avez une expérience de codage, vous n'aurez pas vraiment besoin de plus d'un jour pour vous familiariser avec R. C'est assez simple, en ce qui concerne les langues, et il existe d'excellents tutoriels en ligne.
naught101
1

Une autre bonne alternative est la bibliothèque protovis http://vis.stanford.edu/protovis/

C'est une bibliothèque JavaScript très bien conçue qui peut créer de belles visualisations si vous avez le temps et la capacité d'écrire la quantité modeste de code JavaScript nécessaire.

Je recommande également fortement Tableau http://www.tableausoftware.com . Il est idéal pour explorer rapidement des ensembles de données et créer de nombreuses visualisations différentes.

Les deux produits ont leurs racines au Stanford Visualization Group.

Alex Blakemore
la source
1

Beaucoup d'excellentes réponses ont été données ici, et les langues / bibliothèques que vous choisirez d'apprendre dépendront du type de visualisation que vous souhaitez faire.

Cependant, si vous utilisez régulièrement Python, je recommande fortement Seaborn . Il est très sophistiqué en ce qui concerne la visualisation des données statistiques, mais semble également assez sophistiqué du point de vue de la présentation.

Prenons un exemple. Supposons que vous essayez de tracer la consommation d'électricité d'un immeuble commercial par mois. Un graphe linéaire simple pourrait être généré dans matplotlib à cet effet.

Cependant, si nous voulions rendre la visualisation plus sophistiquée et informative, nous pourrions générer une carte thermique avec Seaborn:

carte de chaleur

Une carte thermique n'est qu'un exemple. Certaines autres utilisations courantes avec Seaborn comprennent:

  • Tracés KDE
  • Parcelles d'essaim
  • Parcelles de violon

L'idée derrière seaborn est de présenter les données d'une manière plus intuitive que ce qui serait possible en utilisant des graphiques plus simples, par exemple, ligne, barre, tarte, etc.

Si cela vous intéresse - vous pouvez trouver plus d'informations sur seaborn ici: https://seaborn.pydata.org/

Michael Grogan
la source
0

R est génial, mais ce n'est pas que R est difficile à apprendre, c'est que la documentation est impossible de rechercher un autre nom comme Rq serait génial. Ainsi, lorsque vous rencontrez un problème, la recherche d'une solution est un cauchemar et la documentation n'est pas très bonne non plus. Matlab ou Octave seront super. Et obtenir ces parcelles en R ou en Matlab serait très très fastidieux.

Les visuels de post-traitement à mon humble avis sont la meilleure voie. Un grand nombre d'entre eux à partir de données fluides sont placés via Adobe Illustrator ou Gimp. C'est plus rapide. Une fois que vous obtenez la structure du tracé, modifiez les détails dans un éditeur. L'utilisation de R comme éditeur ne vous donne pas la flexibilité que vous souhaitez. Vous vous retrouverez constamment à la recherche de nouveaux packages.

Vass
la source
R; function??- R a une aide intégrée. vous pouvez également généralement rechercher «cran» pour trouver des éléments R, et je trouve que la plupart des principaux moteurs de recherche peuvent gérer la lettre unique assez bien.
naught101
0

Voici un didacticiel YouTube sur D3.js qui enseigne les bases de HTML, SVG, CSS et JavaScript, ainsi que la façon de charger des données et de créer un graphique à barres, un graphique linéaire et un nuage de points avec D3.js.

Vignette vidéo

curran
la source
-3

Les ressources sont infinies, mais vous pouvez les affiner en fonction de la façon dont vous souhaitez que vos données soient transformées, du nombre de sources de données que vous traitez, de la façon dont elles doivent être partagées, etc.

Voici un guide sur la façon de choisir la bonne ressource qui pourrait vous aider à vous orienter dans la bonne direction.

Scott Morris
la source
1
Comme vous êtes associé à ce groupe, veuillez déclarer votre intérêt. Les réponses de lien uniquement ne sont pas les plus utiles. Les conseils sur stats.stackexchange.com/help/promotion peuvent s'appliquer.
Nick Cox