Metadata -auto build usando python


11

Abbiamo un ampio repository (oltre 10.000) di dati spaziali (vettori shp / gdb / tab e raster ecw / tif e anche dati las, xyz e DEM) in cui alcuni hanno record di metadati in XML usando l'editor di metadati anzlic. Voglio verificare se ogni set di dati spaziali ha un record xml associato e verificare le proiezioni, l'estensione spaziale, l'origine e le dimensioni rispetto al file spaziale associato.

Ho creato uno script basato su arcpy per estrarre queste informazioni dai formati leggibili dall'ESRI, ma non sono sicuro su come gestire i file di tabulazione e, cosa più importante, come controllarlo con il record xml basato su metaeditor anzlic.

Quindi, se abbiamo citypoints.shp / .tab, dovremmo avere citypoints_metadata.shp / .tab.xml poiché il record dei metadati è separato da citypoints.shp.xml che alcuni software generano automaticamente.

Un'altra domanda simile sul forum è : I metadati ANZLIC sono supportati usando il nuovo approccio di ArcGIS 10.x? ma non copre il requisito per verificare l'esistenza di un record valido e gestire i formati .tab (altri non-esri) in un'area di lavoro open source / creative commons secondo la mia domanda ( Come leggere i file .tab di MapInfo in ArcPy ? ). Ho anche esaminato il software menzionato in Ricerca dell'editor di metadati ISO open source? ma nessuno di essi genera automaticamente il file di metadati di base o consente il confronto di record esistenti con l'origine.


Se qualcuno è interessato, ora ho una soluzione basata su qgis python per questo. Felice di condividere se qualcuno lo chiede.
GeorgeC

Risposte:


2

Guarda il progetto NME

Con esso, puoi avere tutti i metadati supportati da GDAL referenziati in un XML (anche un'opzione di output SQL) usando lo script python gdalogr_catalogue.py con un comando come di seguito

python gdalogr_catalogue.py -d /home/my_directory

Successivamente, tocca a te adattare l'XML recuperato da questa utility per poterlo confrontare con l'editor di metadati anzlic o per personalizzare lo script originale per recuperare esattamente ciò di cui hai bisogno.


1

hai preso in considerazione l'utilizzo della conversione dei formati non ESRI in formati ESRI? Stavo pensando che se lo script funziona bene, perché non usare Gdaltranslate per convertire i set di dati raster e ogr2ogr per convertire i set di dati vettoriali in formati ESRI. Ok, se non vuoi creare nuovi set di dati potresti dare un'occhiata a gdalinfo.exe e ogrinfo.exe come i nomi suggeriscono che entrambi producono metadati che potrebbero essere utili per te.


Non voglio creare dati aggiuntivi: abbiamo oltre 10k file di schede da elaborare.
GeorgeC,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.