Métadonnées -auto build utilisant python

11

Nous avons un grand référentiel (10000 et plus) de données spatiales (vecteurs shp / gdb / tab et rasters ecw / tif et aussi des données las, xyz et DEM) où certains ont des enregistrements de métadonnées en xml en utilisant l'éditeur de métadonnées anzlic. Je veux vérifier si chaque jeu de données spatiales a un enregistrement xml associé et vérifier les projections, l'étendue spatiale, la source et la taille par rapport au fichier spatial associé.

J'ai créé un script basé sur arcpy pour extraire ces informations à partir de formats lisibles par ESRI, mais je ne sais pas comment gérer les fichiers d'onglet et, surtout, comment les vérifier par rapport à l'enregistrement xml basé sur metzeditor anzlic.

Donc, si nous avons citypoints.shp / .tab, nous devrions avoir citypoints_metadata.shp / .tab.xml car l'enregistrement de métadonnées est séparé du citypoints.shp.xml que certains logiciels créent automatiquement.

Une autre question similaire du forum est la suivante: Les métadonnées ANZLIC sont -elles prises en charge à l'aide de la nouvelle approche d'ArcGIS 10.x? mais cela ne couvre pas l'exigence de vérifier l'existence d'un enregistrement valide et de traiter les formats .tab (autres que esri) dans un espace de travail open source / creative commons selon ma question ( Comment lire les fichiers MapInfo .tab dans ArcPy ? ). J'ai également regardé le logiciel mentionné dans Seeking Open Source ISO Metadata Editor? mais aucun d'entre eux ne génère automatiquement le fichier de métadonnées de base ou ne permet de comparer les enregistrements existants avec la source.

GeorgeC
la source
Si quelqu'un est intéressé, j'ai maintenant une solution basée sur qgis python pour cela. Heureux de partager si quelqu'un le demande.
GeorgeC

Réponses:

2

Regardez le projet NME

Avec lui, vous pouvez avoir toutes les métadonnées prises en charge par GDAL référencées dans un XML (également une option de sortie SQL) en utilisant le script python gdalogr_catalogue.py avec une commande comme ci-dessous

python gdalogr_catalogue.py -d /home/my_directory

Après, c'est à vous d'adapter le XML récupéré à partir de cet utilitaire pour pouvoir le comparer avec l'éditeur de métadonnées anzlic ou de personnaliser le script d'origine pour récupérer exactement ce dont vous avez besoin.

ThomasG77
la source
1

avez-vous envisagé de convertir les formats non ESRI en formats ESRI? Je pensais que si votre script fonctionnait bien, pourquoi ne pas utiliser Gdaltranslate pour convertir les jeux de données raster et ogr2ogr pour convertir les jeux de données vectoriels aux formats ESRI. Ok, si vous ne voulez pas créer de nouveaux jeux de données, jetez un œil à gdalinfo.exe et ogrinfo.exe comme les noms suggèrent qu'ils produisent tous deux des métadonnées qui pourraient vous être utiles.

dango
la source
Je ne veux pas créer de données supplémentaires - nous avons plus de 10 000 fichiers d'onglet à traiter.
GeorgeC