Quels sont les avantages et les inconvénients des différents formats de données (performances, taille de fichier, etc.) lorsque l'on envisage une distribution de données ouverte?
Notre organisation souhaite publier des données en tant que données ouvertes. Cependant, il n'y a pas d'idée claire sur les formats de données à utiliser. Bien entendu, plus un format de données est «ouvert», plus il est facile à utiliser.
Quels formats de données sont les plus `` ouverts '' et donc les plus utilisables pour la distribution des données ouvertes en tenant compte des types suivants?:
- données raster (je pense: GeoTIFF, Erdas Imagine IMG?)
- données vectorielles (je pense: GML, CSV, ESRI Shapefile, DXF?)
- données tabulaires (je pense: CSV?)
- Données 3D (je pense: CityGML?)
- Pots de points 3D / LIDAR (je pense: LAS?)
- est-ce que j'oublie quelque chose ici?
De plus, s'il existe de la documentation sur les formats de données ouverts, je suis très intéressé si vous souhaitez partager.
data
file-formats
Mark Verschuur
la source
la source
Réponses:
L'initiative de données ouvertes de la ville de Vienne ( http://data.wien.gv.at ) utilise Geoserver pour fournir un accès aux données géographiques tramées et vectorielles via les services Geoserver WMS et WFS . Cela présente de nombreux avantages: les utilisateurs peuvent télécharger des données dans différents formats pour une utilisation hors ligne (par exemple, geojson, KML ou Shapefiles zippés) ou utiliser les services en direct en les incorporant dans des cartes en ligne ou des projets SIG.
la source
Pour les CSV tabulaires. Excel est au mieux trop compliqué et au pire totalement inaccessible. L'accès n'est pas accessible et le PDF est une claque au visage.
Pour une utilisation géospatiale, geojson, c'est du texte, il est bien pris en charge et n'a pas les restrictions techniques que le seul autre format viable (shapefile) a. Aussi, sauf si vous avez une très bonne raison, il devrait être dans WGS84, sachant que la plupart des utilisateurs seront dans un autre état et ne voudront pas de plan d'état.
la source
J'aime assez NetCDF pour les données continues / matricielles (c'est-à-dire les rasters). Les avantages de NetCDF sont:
Le seul inconvénient de NetCDF4 que je peux voir est la faible prise en charge des packages SIG standard comme ArcGIS et QGIS (bien que j'aimerais beaucoup être corrigé à ce sujet!).
EDIT Quelques autres packages qui prennent en charge NetCDF
Certains langages de programmation standard qui prennent en charge NetCDF (mais pour être honnête, tout ce qui peut lire HDF peut lire NetCDF4):
Pour les utilisateurs de mathématiques et de statistiques, vous avez:
Plus précisément dans le SIG:
Si vous souhaitez consulter rapidement un fichier NetCDF, j'utiliserais le Panoply multiplateforme de la NASA. Et si vous êtes intéressé par plus, UCAR Unidata a une liste de logiciels .
la source
Je dirais:
Ces formats sont facilement lisibles par les logiciels Open Source et sont facilement transformables en tout autre format nécessaire pour des applications spécifiques.
Aussi +1 pour ouvrir les données!
la source
Pratiquement cette même question s'est posée à opendata.SE: Quels sont les formats les plus utiles pour publier des données géospatiales?
Donc, j'espère que je ne viole aucune politique en citant ma propre réponse:
Mon expérience, la création de cartes à partir de plusieurs jeux de données gouvernementaux:
Pour les données ponctuelles, CSV est le meilleur, avec des colonnes "lat" et "lon". Très facile à utiliser dans une large gamme d'outils, y compris les éditeurs de texte, les feuilles de calcul, etc. Il y a deux inconvénients:
.vrt
fichier compagnon.lat
etlon
n'est pas totalement standard. De nombreux outils sont assez libéraux dans ce qu'ils acceptent.Pour les lignes et les polygones, par ordre décroissant de préférence:
Honnêtement, cependant, la meilleure réponse est probablement «tous». Faites plaisir à tout le monde et publiez les données en CSV (si point), GeoJSON, Shapefile zippé et KMZ.
la source