Ressources pour apprendre à utiliser (/ créer) la visualisation statistique dynamique (/ interactive)

14

J'aimerais en savoir un peu plus sur la visualisation interactive des données (zoom, pointage, brossage, mappage de points, etc.). Je souhaite la bienvenue à tout:

  1. Tutoriel / guide / livre (?) / Vidéo sur la façon d'utiliser ces méthodes pour l'exploration statistique.
  2. Pointeurs pour de bons / intéressants packages interactifs de visualisation de données (dans R et en dehors)

Pour commencer, je sais que dans R, il existe différentes façons d'obtenir une visualisation interactive, comme rggobi , le nouveau package googleViz R , le package d'animation et quelques autres. Mais s'il existe d'autres packages qui méritent d'être explorés (offrant des choses que R ne propose pas), je serais heureux de les connaître (comme jmp, mathlab, spss, sas, excel, etc.).

ps: c'est la première question à utiliser le tag "interactif-visualisation"

Tal Galili
la source
Je suppose que @Shane aura quelque chose à dire ici en parlant de webvis (analyseur pour protovis) puisque protovis (dédié à la visualisation web) ( vis.stanford.edu/protovis ) contient la possibilité de graphiques interactifs ...
robin girard
Dans R, il existe également des iPlots et Rgl , mais les solutions basées sur Javascript ou Python peuvent être plus flexibles.
Vincent Zoonekynd

Réponses:

13

En dehors de Protovis (HTML + JS) ou Mayavi (Python), je recommanderais Processing qui est

un langage et un environnement de programmation open source pour les personnes qui souhaitent créer des images, des animations et des interactions. Initialement développé pour servir de carnet de croquis logiciel et pour enseigner les bases de la programmation informatique dans un contexte visuel.

Il y a beaucoup de scripts open-source sur http://www.openprocessing.org/ , et beaucoup de livres connexes qui traitent du traitement mais aussi de la visualisation des données.

Je sais qu'il y a un projet pour fournir une interface R, un retraitement , mais je ne sais pas comment ça se passe. Il y a aussi une interface avec clojure / incanter (voir par exemple, Création de visualisations de traitement avec Clojure et Incanter ).

Il existe de nombreuses ressources en ligne, parmi lesquelles des notes de cours de Stanford, par exemple CS448B , ou 7 documents classiques de base visuels que vous pourriez ne pas vouloir avouer publiquement que vous ne savez pas .

chl
la source
6

Quelques packages supplémentaires à ajouter à la suggestion de Chl de Traitement pour créer des visualisations interactives. Tous ceux-ci sont basés sur javascript et peuvent s'exécuter dans un navigateur, ils peuvent donc être utilisés pour la publication ainsi que pour votre propre analyse:

  • D3.js est le successeur de Protovis. Il est plus puissant en ce sens que vous avez plus de contrôle sur les objets créés (ce sont des objets DOM appropriés, c'est-à-dire que vous avez un contrôle total sur eux en utilisant javascript), mais certains préfèrent Protovis pour plus de simplicité. Bonne discussion technique D3 vs Protovis ici .
  • Raphael.js est une bonne option pour une interactivité Web hautement personnalisée sur le marché de masse car il est à la fois à l'épreuve du temps (pas de flash) et fonctionne sur des navigateurs aussi anciens que IE6 (la seule chose sur laquelle il ne fonctionne pas à ma connaissance, ce sont les anciennes versions de le navigateur Android). Comme D3, tout est un objet DOM ciblable et il a de bons contrôles api intégrés pour l'animation et l'interactivité. Il n'offre rien de spécifique à la visualisation: c'est une ardoise vierge très puissante et flexible, un excellent choix pour concevoir des visualisations personnalisées mais pas pour votre propre analyse exploratoire initiale. Familiarisez-vous d'abord avec vos données.
  • gRaphael.js est des graphiques standard (barre, ligne, etc.) pour Raphael. C'est basique mais fonctionne et peut être construit - pourrait être un ingrédient utile si vous construisez votre propre suite.

Concernant votre autre question sur l'apprentissage, pour les principes généraux, Information Dashboard Design mérite une mention, si ce que vous voulez est de créer un tableau d'outils standard interactifs à usage général pour vos données.

Les visualisations interactives sont à la frontière entre les statistiques et la conception d'interactivité : des livres à ce sujet peuvent donc être utiles. Je n'ai aucune expérience personnelle de l'un des nombreux manuels de conception d'interaction, mais je suis un grand fan des principes universels de conception . Cela peut être exagéré pour vos besoins, mais envisagez de consulter la colonne Convivialité dans son excellente page de contenu catégorique et de lire les chapitres répertoriés (divulgation progressive, signal au bruit, etc.).

De plus, pour toute personne novice en programmation, la programmation de l'interactivité est un bon point de départ pour renforcer les compétences techniques (elle comprend également un lourd chapitre sur le traitement).

Mais pour savoir ce qui fonctionne et ce qui est possible, vous ne pouvez pas battre l'apprentissage par la pratique , et un bon début pourrait être d'envisager de suivre et d'analyser les packages de visualisation interactive à usage général de grand nom comme le tableau et jmp et réfléchissez à la raison pour laquelle leurs fonctionnalités sont conçues telles quelles.

user56reinstatemonica8
la source
Merci d'avoir édité dans les liens whuber - battez-moi!
user56reinstatemonica8
4

En plus de Processing, découvrez la Nodebox basée sur Python (1, 2, OpenGL), qui a été inspirée par Processing:

Nodebox 1 est uniquement Mac, tandis que Nodebox 2 et la version OpenGL sont multi-plateformes.

Python a une tonne de bibliothèques de crunching de données qui peuvent être importées dans Nodebox, par exemple, scipy.org

Ed Hagen
la source
1

En tant qu'approche distincte des réponses existantes, peu de temps après avoir publié ma première longue liste, WEAVE a émergé: une suite open source dédiée de visualisation de données. Voici un bref article sur WEAVE sur les principales données du blog Flowing Data

Il est sage d'adopter une approche différente de la visualisation des données selon l'endroit où vous en êtes dans le processus. Plus vous êtes tôt - plus vos données sont brutes et inexplorées - plus vous avez de chances de bénéficier de suites polyvalentes prédéfinies et flexibles comme WEAVE et de ses homologues commerciaux à source fermée comme Tableau et JMP - vous pouvez essayer les choses rapidement et sans effort pour connaître les données et déterminer les lignes d'attaque à prendre pour en tirer le meilleur parti.

Au fur et à mesure que vous en découvrirez davantage sur les données, votre attention se tournera probablement vers la communication ou `` l'exploration guidée '' - des visualisations de données exploratoires plus personnalisées conçues en fonction des mises en garde, des nuances et des domaines d'intérêt que vous avez maintenant découverts dans les données. C'est là que les produits d'ardoise vierge tels que les outils de dessin vectoriel programmatique répertoriés ci-dessus entrent en jeu.

user56reinstatemonica8
la source