J'ai un ensemble de données de taille décente - 500 000 enregistrements, chacun représentant un événement.
Les champs sont:
- Date
- temps
- qui a fait l'événement
- quel était l'événement (il y aura, disons, 5 à 10 types d'événements)
- le lieu de l'événement (il y aura environ 20 emplacements pour un événement)
- 'autres choses'
il y a environ 500 à 1000 événements par jour
Mon ultime fantasme serait d'avoir une vidéo arrimée à une certaine échelle de temps - il manque juste 2 ans de données, alors faites la vidéo (pour discussion) 2 minutes, chaque minute est un an, et ainsi de suite. Chaque emplacement serait représenté comme un cercle d'une certaine taille qui grandirait à mesure que des événements «se produiraient» à ces emplacements. Une version encore plus perverse de ce fantasme est où chaque cercle est un graphique à secteurs et les segments à secteurs grandissent / rétrécissent en fonction du type d'événement à chaque emplacement.
Existe-t-il des outils prêts à l'emploi, ou des bibliothèques open source pour python, ou un site Web que quelqu'un recommanderait?
Est-ce le genre de chose que vous embauchez quelqu'un à un taux élevé pour faire pour vous?
la source
Réponses:
Il existe deux bibliothèques JavaScript que vous pourriez trouver utiles pour retirer quelque chose comme ceci:
Sinon, il existe de très nombreuses bibliothèques de graphiques que vous pourriez adapter, certaines Flash, certaines PHP, certaines jQuery. Digg faisait des visualisations vraiment sympas dans les laboratoires Digg, mais malheureusement, tout ce qui reste maintenant après leur refonte est cette vidéo .
la source
Découvrez cette présentation de Hans Rosling.
Il est disponible sur gapminder.org et sur Google Spreadsheets.
la source
Comme vous avez des emplacements, le résultat peut être une carte interactive. Les logiciels de cartes interactives open source ne sont pas très nombreux, mais vous pouvez générer des images statiques puis les assembler dans une animation.
Une excellente combinaison de logiciels est R + python + FOSS GIS (gratuit et open source, comme GRASS ou QGIS). Certains contenus pédagogiques d'introduction sont répertoriés ici: http://www.osgeo.org/educational_content
En tant que cartographe professionnel, on m'a récemment demandé de créer un outil de visualisation en ligne de valeurs quantitatives spatialisées sous forme de points, au fil du temps, et j'ai utilisé la bibliothèque GeoExt, un pont entre le cadre Web Ext.JS de Sencha et le cadre de cartographie OpenLayers, mais c'est peut-être un peu compliqué.
la source
Vous pouvez vérifier cela: http://insideria.com/2009/12/28-rich-data-visualization-too.html
la source
Il existe un éventail ahurissant de possibilités de traitement des données géospatiales. En fait, vous pouvez utiliser Google Earth pour cela. Google Earth a une chronologie intégrée et de nombreuses fonctionnalités. Il n'est plus autonome et s'intègre facilement au Web.
Voici une longue liste d'outils géospatiaux.
gephi
Gephi en lui-même est un outil de visualisation de réseau, mais il existe de nombreux plugins, également pour le géospatial.
Gapminder Voir cette phénoménale présentation TED par Hans Rosling - love that guy
Gapminder a été mentionné ci-dessus, mais pourrait facilement être mentionné à nouveau :)
Graphiques Google
Les graphiques Google peuvent gérer le Big Data, mais vous devez vérifier les limitations et savoir si vous devrez payer pour un compte Big Data.
somvis
Un joli outil sur l'exploration de données de grands ensembles de données.
Raphaël
Également mentionné ci-dessus. À ma connaissance, Raphael a certaines limites quant aux très gros volumes de données.
Exposition du MIT (anciennement appelée Similie)
Cela fait un moment que je n'ai pas joué avec Similie, mais rappelez-vous qu'ils ont une capacité pour le big data. Les visuels ne sont peut-être pas les plus élégants, mais vous pouvez le faire vous-même.
d3
Un des bons vieux, javascript hautement adaptable.
Highcharts
Très professionnel et polyvalent (j'adore qu'ils soient directement liés à jsfiddle pour leurs cartes). Vous pouvez payer pour les solutions haut de gamme, et cela devrait facilement gérer de grandes données en direct.
la source