Je souhaite apprendre à créer le type de visualisations que vous voyez sur http://flowingdata.com et informationisbeautiful. EDIT: Signification, visualisations qui sont intéressantes en elles-mêmes - un peu comme les graphiques du NY Times, par opposition à quelque chose de rapide pour un rapport.
Quels types d'outils sont utilisés pour les créer - s'agit-il principalement d'Adobe Illustrator / Photoshop? Quelles sont les bonnes ressources (livres, sites Web, etc.) pour apprendre à utiliser ces outils en particulier pour la visualisation des données?
Je sais à quoi je veux que les visualisations ressemblent (et je connais les principes de conception, par exemple, dans les livres de Tufte), mais je n'ai aucune idée de comment les créer.
la source
Le traitement déjà mentionné a un bel ensemble de livres disponibles. Voir: 1 , 2 , 3 , 4 , 5 , 6 , 7
Vous trouverez beaucoup de choses sur le Web pour vous aider à commencer avec R. Comme étape suivante, ggplot2 a une excellente documentation Web . J'ai également trouvé le livre de Hadley très utile.
Python pourrait être une autre façon de procéder. Surtout avec des outils comme:
Tous les projets sont bien documentés sur le web. Vous pourriez également envisager de jeter un œil à certains livres .
Enfin, le livre Graphics of Large Datasets pourrait également être utile.
la source
igraph
travaille également en R; pour 3D openGL accéléré vis dans R, utilisezrgl
&misc3d
packages.matplotlib
parcelles sont également laides; ils peuvent être bien pour un utilisateur de gnuplot de longues années.Vous passerez beaucoup de temps à vous familiariser avec R.
RapidMiner est gratuit et open source et graphique, et a beaucoup de bonnes visualisations, et vous pouvez les exporter.
Si vous avez de l'argent à perdre, ou si vous êtes un membre du personnel universitaire / étudiant, JMP est également très sympa. Il peut faire de très jolis graphes, très très facilement. Peut exporter au format flash ou PNG ou PDF ou ce que vous avez.
la source
Une autre bonne alternative est la bibliothèque protovis http://vis.stanford.edu/protovis/
C'est une bibliothèque JavaScript très bien conçue qui peut créer de belles visualisations si vous avez le temps et la capacité d'écrire la quantité modeste de code JavaScript nécessaire.
Je recommande également fortement Tableau http://www.tableausoftware.com . Il est idéal pour explorer rapidement des ensembles de données et créer de nombreuses visualisations différentes.
Les deux produits ont leurs racines au Stanford Visualization Group.
la source
Beaucoup d'excellentes réponses ont été données ici, et les langues / bibliothèques que vous choisirez d'apprendre dépendront du type de visualisation que vous souhaitez faire.
Cependant, si vous utilisez régulièrement Python, je recommande fortement Seaborn . Il est très sophistiqué en ce qui concerne la visualisation des données statistiques, mais semble également assez sophistiqué du point de vue de la présentation.
Prenons un exemple. Supposons que vous essayez de tracer la consommation d'électricité d'un immeuble commercial par mois. Un graphe linéaire simple pourrait être généré dans matplotlib à cet effet.
Cependant, si nous voulions rendre la visualisation plus sophistiquée et informative, nous pourrions générer une carte thermique avec Seaborn:
Une carte thermique n'est qu'un exemple. Certaines autres utilisations courantes avec Seaborn comprennent:
L'idée derrière seaborn est de présenter les données d'une manière plus intuitive que ce qui serait possible en utilisant des graphiques plus simples, par exemple, ligne, barre, tarte, etc.
Si cela vous intéresse - vous pouvez trouver plus d'informations sur seaborn ici: https://seaborn.pydata.org/
la source
Voici un bon ensemble de liens avec des ressources pour commencer à apprendre:
la source
R est génial, mais ce n'est pas que R est difficile à apprendre, c'est que la documentation est impossible de rechercher un autre nom comme Rq serait génial. Ainsi, lorsque vous rencontrez un problème, la recherche d'une solution est un cauchemar et la documentation n'est pas très bonne non plus. Matlab ou Octave seront super. Et obtenir ces parcelles en R ou en Matlab serait très très fastidieux.
Les visuels de post-traitement à mon humble avis sont la meilleure voie. Un grand nombre d'entre eux à partir de données fluides sont placés via Adobe Illustrator ou Gimp. C'est plus rapide. Une fois que vous obtenez la structure du tracé, modifiez les détails dans un éditeur. L'utilisation de R comme éditeur ne vous donne pas la flexibilité que vous souhaitez. Vous vous retrouverez constamment à la recherche de nouveaux packages.
la source
R; function??
- R a une aide intégrée. vous pouvez également généralement rechercher «cran» pour trouver des éléments R, et je trouve que la plupart des principaux moteurs de recherche peuvent gérer la lettre unique assez bien.Voici un didacticiel YouTube sur D3.js qui enseigne les bases de HTML, SVG, CSS et JavaScript, ainsi que la façon de charger des données et de créer un graphique à barres, un graphique linéaire et un nuage de points avec D3.js.
la source
voici une ressource pratique pour démarrer avec d3. Il comprend un code de démonstration et un exemple étape par étape sur la façon de charger, organiser et visualiser un ensemble de données dans d3.
https://www.edx.org/course/web-app-development-with-the-power-of-nodejs
la source
Les ressources sont infinies, mais vous pouvez les affiner en fonction de la façon dont vous souhaitez que vos données soient transformées, du nombre de sources de données que vous traitez, de la façon dont elles doivent être partagées, etc.
Voici un guide sur la façon de choisir la bonne ressource qui pourrait vous aider à vous orienter dans la bonne direction.
la source