Des outils open source pour visualiser des données multidimensionnelles?

31

Outre gnuplot et ggobi , quels outils open source les gens utilisent-ils pour visualiser des données multidimensionnelles?

Gnuplot est plus ou moins un package de base de traçage.

Ggobi peut faire un certain nombre de choses astucieuses, telles que:

  • animer des données le long d'une dimension ou parmi des collections discrètes
  • animer des combinaisons linéaires variant les coefficients
  • calculer les principaux composants et autres transformations
  • visualiser et faire pivoter des clusters de données en 3 dimensions
  • utiliser des couleurs pour représenter une dimension différente

Quelles autres approches utiles sont basées sur l'open source et donc librement réutilisables ou personnalisables?

Veuillez fournir une brève description des capacités du package dans la réponse.

utilisateur87
la source
4
Je me demande s'il n'est pas plus judicieux de demander des méthodes de visualisation, plutôt que des packages, d'autant plus que la plupart des réponses fournissent peu de détails, et de nombreux packages fournissent les mêmes méthodes. Voir, par exemple, stats.stackexchange.com/questions/41326/…
naught101

Réponses:

13

Que diriez-vous de R avec ggplot2 ?

Autres outils que j'aime beaucoup:

Shane
la source
ggplot2 est juste un package graphique? Qu'en est-il qui vous le recommande pour les données multidimensionnelles? Facettant?
naught101
14
  • Mondrian : Analyse exploratoire des données en mettant l'accent sur les grandes données et bases de données.
  • iPlots : un package pour l'environnement statistique R qui fournit des graphiques statistiques à haute interaction, écrits en Java.
rcs
la source
+1 pour Mondrian - jouet très utile, en particulier pour les données volumineuses
radek
grandes données! = haute dimensionnalité. Mondrian est-il plus utile que d'autres packages pour une haute dimensionnalité?
naught101
11

Le paquet de treillis dans R.

Lattice est un système de visualisation de données de haut niveau puissant et élégant, avec un accent sur les données multivariées, qui est suf fi sant pour les besoins graphiques typiques, et est également suffisamment flexible pour gérer la plupart des exigences non standard.

Quick-R a une introduction rapide .

Jeromy Anglim
la source
Il h. Je ne peux pas modifier cette réponse pour ajouter ce lien car il est trop court. Avec 4 votes positifs, il doit y avoir au moins quelques personnes suffisamment familiarisées avec le réseau pour pouvoir ajouter quelques lignes de description, afin de rendre cette réponse à mi-chemin utile ...
rien101
1
bon point. J'ai ajouté un texte de présentation et votre lien rapide
Jeromy Anglim
4

ggobi et les liens R vers Ggobi sont vraiment plutôt bons pour cela. Il existe des visualisations plus simples (iPlots est très agréable, également interactif, comme mentionné).

Mais cela dépend si vous faites quelque chose de plus spécialisé. Par exemple, TreeView vous permet de visualiser le type de dendrogrammes de cluster que vous sortez des puces à ADN.

Paul Hewson
la source
3

Les points de vue sont utiles pour les ensembles de données à plusieurs variables.

mankoff
la source
Je ne peux que seconder cela ... à partir de ce que j'ai vu, pouvez-vous sélectionner des données avec la souris dans une projection tout en regardant à quoi ressemble le sous-ensemble sélectionné dans une autre projection.
Andre Holzner
0

Regardez également la bibliothèque de traçage de données SCaVis . Il fonctionne sur n'importe quelle plate-forme depuis Java. Il prend en charge de nombreux conteneurs de données et styles de tracé (2D, 3D, etc.)

IraS
la source