Est-ce que quelqu'un connaît un bon logiciel open source permettant de visualiser des données à partir d'une base de données?

50

Récemment, je suis tombé sur Tableau et j'ai essayé de visualiser les données de la base de données et du fichier csv. L'utilisateur iterface permet à l'utilisateur de visualiser les données temporelles et spatiales et de créer des tracés en un instant. Un tel outil est vraiment utile car il permet d’observer graphiquement les données sans écrire le code.

Comme il existe de nombreuses sources de données à partir desquelles je dois extraire et visualiser les données, il serait très utile de disposer d'un outil permettant de générer des graphiques en faisant simplement glisser des colonnes sur des axes et en modifiant la visualisation en faisant également glisser les noms de colonnes.

Est-ce que quelqu'un connaît un logiciel libre ou open source de ce type?

niko
la source
1
Par base de données, voulez-vous dire SQL, Postgres, structures de type mongo? ( Induction for Mac possède de telles fonctionnalités.) Ou recherchez-vous un programme qui accepte les fichiers CSV et permet de glisser-déposer des colonnes sur des modèles graphiques ou à la GGobi ?
chl
J'ai créé un outil de traceur github.com/burlachenkok/plotter_plusplus
bruziuz

Réponses:

38

Je ne l'ai jamais essayé, mais il existe une suite de visualisation open source basée sur un ordinateur de bureau / navigateur appelée WEAVE (abréviation de Web-based Analysis and Visualization Environment). Comme Tableau, il est conçu pour vous permettre d'explorer des données via une interface interactive à base de clics. Contrairement à Tableau, il est open source: vous pouvez télécharger le code source et installer votre propre version sur votre propre machine, laquelle peut être aussi privée ou publique que vous le souhaitez. Ne vous attendez pas quoi que ce soit presque aussi lisse et convivial Tableau, mais il ressemble à un intéressant projet puissant pour quelqu'un prêt à mettre le temps pour apprendre à l' utiliser.

entrez la description de l'image ici entrez la description de l'image ici entrez la description de l'image ici


Ou, vous pouvez envisager de rouler le vôtre . Il existe de très bons outils javacript open source pour prendre en charge la visualisation des données de programmation dans un navigateur. Si cela ne vous dérange pas de coder du Javascript et une sorte de couche côté serveur pour servir les données, essayez-les:

  • Jeu de données Miso pour obtenir, traiter, gérer et nettoyer les données côté client en Javascript (inclut un analyseur CSV)
  • D3 pour les visualisations interactives en SVG (fonctionne dans tous les navigateurs sauf IE8 et les téléphones Android plus anciens et plus anciens (v1, v2)).
  • gRaphael pour les graphiques standard interactifs multi-navigateurs
  • Raphael si vous avez besoin que la sortie SVG fonctionne dans Internet Explorer 6, 7 et 8.

    • D34Raphael combine les outils de visualisation de D3 avec la compatibilité et l'abstraction IE de Raphael
    • Si vous maîtrisez le javascript, Raphael est un bon moyen de créer quelque chose de personnalisé.
    • Voici une approche différente du pompage de la sortie D3 via Raphael pour être multi-navigateur
    • Astuce: Si vous décidez de travailler avec Raphael et que la dernière version est toujours la 2.1.0, je vous conseillerais d' appliquer ce correctif au code ).

Si vous êtes intéressé par l'option de programmation Web, voici un article un peu plus détaillé que j'ai écrit sur Raphael et D3 pour stackoverflow .


Il y a aussi quelques suites datavis en ligne gratuites (non open source) à mentionner (probablement pas appropriées pour une connexion directe à une base de données mais méritent un coup d'oeil):

  • Raw by Density Design - introduction au blog - (cliquez sur "Choisissez un échantillon de données" pour l'essayer). La plupart du temps, copiez-collez, ne savez pas s'il dispose d'une API capable de se connecter à une base de données, mais permet d'essayer rapidement.
  • Tableau Public - une version en ligne gratuite de Tableau. Le problème est que les données que vous entrez et toutes les visualisations que vous créez doivent être accessibles au public.

Et quelque chose de complètement différent: si vous avez un serveur de qualité qui traîne et que vous voulez créer d’impressionnantes cartes glissantes de style google-maps à l’ aide de technologies open source (probablement pas ce que vous recherchez - mais c’est possible! ), consultez MapBox TileMill . Jetez un coup d’œil à la galerie d’exemples sur leur page d’accueil - certains sont vraiment sensationnels. Voir également le projet connexe Modest Maps , une bibliothèque Javascript open source permettant d’interagir avec les cartes développée par Stamen Design (une agence de grande qualité spécialisée dans les cartes interactives). Cela est considéré comme une amélioration par rapport aux OpenLayers plus établis. Tous les open source.

entrez la description de l'image ici


WEAVE est le meilleur outil open source basé sur une interface graphique que je connaisse pour l' analyse visuelle personnelle .

Les autres outils répertoriés sont des outils haut de gamme pour la publication en ligne de visualisations (par exemple, D3 est utilisé et développé par l’ équipe graphique primée du NY Times ), et est plus souvent utilisé pour la visualisation dans le contexte de la communication avec le public. communications que l'analyse exploratoire, mais ils peuvent également être utilisés pour l'analyse.

utilisateur56reinstatemonica8
la source
7

Les interfaces pointer-cliquer semblent plus faciles, mais à long terme, vous pourrez en apprendre plus sur "l'écriture du code".

Un des avantages des systèmes basés sur des scripts par rapport aux interfaces point-clic-glissement est le suivi / historique d'audit (certaines interfaces graphiques ont un historique, mais elles ne sont généralement pas aussi faciles à utiliser qu'un script enregistré). Si vous écrivez du code pour créer votre graphique et le sauvegarder, il est toujours facile de le réexécuter ou de faire de petites modifications puis de le réexécuter. Il n'est pas toujours facile de se souvenir de l'ensemble des clics et des traînées utilisés pour créer un graphique précédent.

Les scripts seront également beaucoup plus rapides pour un grand nombre de parcelles. Il faudra un peu plus de temps pour écrire le code pour le premier tracé, mais ajouter seulement quelques lignes et quelques petites modifications peut vous permettre de parcourir des centaines ou plus de variables avec un minimum d'effort supplémentaire lorsque vous devez effectuer le même ensemble de clics. et traîne encore et encore pour chaque parcelle.

La plupart des outils de traçage basés sur des scripts ont des interfaces graphiques qui vous permettent d'utiliser des points et des clics pour commencer, mais vous aident à apprendre le code et à passer aux méthodes plus puissantes.

Je recommande R qui est gratuit et open source et qui dispose de quelques interfaces graphiques (Rcmdr, jgr, rstudio, etc.) comme une bonne option.

Greg Snow
la source
4
Bien que les outils basés sur des scripts vous aident à générer le même graphique de manière répétée avec différentes sources de données, les outils interactifs sont bien meilleurs pour l'exploration et la découverte dans un nouvel ensemble de données. Lorsque vous posez une question, il vous suffit de cliquer sur un bouton ou sur deux pour modifier l’axe, les échelles de couleurs, les regroupements, etc. au lieu d’écrire le code. Il s'agit d'un coût beaucoup plus bas, et une vue d'annulation de pile ou d'historique d'exploration vous permettra de revenir en arrière si vous faites des erreurs.
Edallme
1
@edallme, je ne suis pas d'accord. Ce que vous dites peut être vrai pour les personnes qui connaissent les bases d’une interface graphique et qui ne connaissent pas les outils de script, mais je pense que c’est un argument pour apprendre les outils de script. Dans mon cas, je prévois que frapper la flèche haut, la flèche gauche et taper quelque chose comme "col.axis = 'blue" "prend moins de temps que de passer ma main à la souris, de cliquer sur un tracé et de parcourir les options. . Pour une personne commençant une interface graphique, elle peut donner une idée de ce qu'il est possible de changer, mais je préfère ceux qui affichent le code afin qu'ils apprennent la meilleure approche.
Greg Snow
1
J'aime l'approche de Stata consistant à utiliser une interface graphique pour choisir les options, puis à cracher du code que vous pouvez réutiliser lorsque vous cliquez sur "Ok". Il est utile de disposer de scripts lorsque vous devez automatiser des tâches. Mais la recherche exploratoire est beaucoup plus que de changer les paramètres de la carte une ou deux fois. Dans les bons outils interactifs, les utilisateurs peuvent changer les colonnes utilisées pour un graphique en cliquant sur un bouton ou une touche fléchée, filtrer en sous-ensembles de données avec un curseur ou une interaction glisser-déposer, et effectuer un brossage entre les graphiques montrant les points de données connectés. . De plus, chaque modification est rendue en moins de 100 ms et ne pénalise pas les utilisateurs.
Edallme
1
Il est intéressant d’ajouter aujourd’hui les packages R qui facilitent beaucoup les applications Web. Voir brillant ou opencpu
jangorecki
@GregSnow: cela dépend vraiment du package de visualisation. Je peux obtenir un scénario vraiment sympa et détaillé avec des facettes et tout ce jazz qui fonctionne dans ggplot, beaucoup plus rapidement que n'importe quelle interface graphique. On ne peut pas en dire autant de matplotlib, des graphes de base R et de nombreux autres packages.
naught101
1

Vous pouvez utiliser le service cloud gratuit à l' adresse https://my.infocaptor.com/free_data_visualization.php.

La version en ligne vous permet de télécharger toutes les données csv / excel et de les visualiser rapidement. Vous n'avez pas besoin de vous connecter pour cela. Si vous souhaitez utiliser des bases de données, vous devez vous connecter ou vous pouvez télécharger le logiciel.

PS: Je fais partie de la société qui fabrique ce produit

Nilesh
la source
Bienvenue sur notre site. C'est un peu clairsemé, pouvez-vous en ajouter? De plus, je suppose que ceci est votre propre service, donc vous devriez le mentionner (mais je pense que ça va de poster ici si c'est gratuit et que vous êtes ouvert à ce sujet).
gung - Rétablir Monica
1

Il existe un nouvel outil appelé Helical Insight, un outil de BI de source ouverte qui permet de créer des graphiques, des rapports, des tableaux de bord et diverses visualisations de données. Grâce à cela, vous pouvez créer des rapports de deux manières: BI en libre service et BI instantané. Dans la BI en libre service, vous faites glisser les colonnes que vous voulez, ajoutez des filtres pour créer des aperçus. 'Instant BI' est une fonctionnalité dans laquelle vous pouvez taper n'importe quelle question commerciale et obtenir un aperçu instantané en conséquence. En ce qui concerne la visualisation des données, vous pouvez avoir des graphiques simples intégrés, des graphiques scientifiques et il est également très bon d’y intégrer votre propre graphique. Visitez www.helicalinsight.com

Bruce
la source
1

Il y a en fait une réponse correcte à cette question, Orange . Il y avait déjà environ 2. quelque chose de communiqué au moment où la question a été publiée. Sur les systèmes basés sur Linux, il peut être simplement installé via l’ index de paquet Python avec pip install orange3. Il figure également dans le référentiel utilisateur Arch pour Arch Linux, Manjaro, ALARM et d’autres distributions basées sur Arch.

En outre, il y a pratiquement une même question sur StackExchange qui mentionne quelques autres alternatives commerciales / Web (qui sont fermées et renvoient ici). Quora peut en trouver quelques-uns de plus , mais Orange est le seul logiciel open-source compilé qui possède une interface graphique à la fois, à ma connaissance. Il a une interface plutôt perfectionnée, esthétique et minimaliste à mon avis.

drws
la source
0

Il existe également un nouveau programme pour la lecture (automatisée), le filtrage, le traitement, l’interpolation et le traçage de valeurs n-dimensionnelles à partir de différentes sources (telles que les fichiers libreOffice ou csv) et de taille variable: diaGrabber .

Vous devez utiliser quelques commandes python simples pour créer un cas. Après cela, vous pouvez manipuler la sortie graphique dans une interface graphique interactive .

KarlB
la source