Abbiamo utilizzato un file system organizzato gerarchicamente per: - estensione geografica (paese o continente) - fornitore di dati, licenziante - dominio / set di dati - data / versione
Successivamente abbiamo una politica per separare i dati di origine (nello stesso formato che era su qualunque CD / DVD che abbiamo ottenuto dal fornitore) da qualsiasi set di dati derivati che abbiamo prodotto all'interno della nostra azienda.
Il file system semplifica l'immissione dei dati dal cliente e consente anche una certa flessibilità in termini di archiviazione fisica: manteniamo i nostri archivi su dischi più grandi e più lenti e disponiamo di file server speciali (collegati in modo trasparente nella gerarchia) per i set di dati utilizzati più frequentemente.
Per facilitare la gestione all'interno dei progetti, utilizziamo collegamenti simbolici. Manteniamo i nostri vettori in un database (Oracle) e rendiamo una regola avere almeno un'istanza di database per cliente (e diversi utenti / schemi per i progetti). Non abbiamo tenuto molti raster in un database, poiché tendono a occupare troppo spazio anche al di fuori di uno. Inoltre, ci piace mantenere le nostre istanze di database il più leggere possibile.
E sì, abbiamo qualcuno incaricato di "sorvegliare" l'intera cosa in modo che non diventi troppo disordinato.
Il problema più grande che abbiamo attualmente con questa configurazione è la mancanza di una bella interfaccia utente che ci aiuterebbe a avere una visione d'insieme migliore dell'intera cosa e abbiamo in programma di includere uno spazio di archiviazione dei metadati. Stiamo ancora considerando le nostre opzioni qui.
Stiamo usando il controllo della versione per il nostro codice e l'abbiamo usato per i documenti, ma risulta che il controllo della versione non è realmente realizzato per set di dati di grandi dimensioni, soprattutto se si tratta principalmente di file binari, quindi non consiglierei , tranne se hai a che fare con GML o qualcosa di simile a un testo (i problemi includono enormi spese generali sull'utilizzo del disco sul lato server e client che si arrestano in modo anomalo durante il check out di enormi repository).