Pertanto, GDAL ha recentemente aggiunto una nuova funzionalità che consente la lettura casuale dei file bucket S3. Sto cercando di ritagliare le immagini GDAL da più riquadri di un'immagine senza dover scaricare l'intero file. Ho visto solo una documentazione molto scarsa su come configurare e accedere a un bucket S3 tramite GDAL e sono un po 'confuso su come iniziare? Qualcuno sarebbe abbastanza gentile da fornire un esempio / tutorial estremamente breve su come procedere per impostare il filesystem virtuale per GDAL al fine di raggiungere questo obiettivo? Punti bonus se la tua soluzione ne consente lo script tramite Python!
Per chiarire: l'abbiamo già fatto in Python. Il problema con Python è che devi scaricare l'intera immagine per farla funzionare. La versione più recente di GDAL ha il supporto per il montaggio della benna S3 in modo che se dobbiamo dire ritagliare una piccola porzione dell'immagine, possiamo operare direttamente su quella porzione più piccola. Purtroppo, dato che la funzione è stata rilasciata sul ramo stabile a gennaio, non ho trovato alcuna documentazione su di essa. Quindi la soluzione dovrebbe usare il sistema VSI3 nella versione più recente di GDAL o altrimenti utilizzare in modo intelligente il sistema per impedire all'utente di scaricare l'intera immagine su un'unità EBS per operare su di essa.
Vale a dire che la taglia verrà assegnata per rispondere che utilizza le API VSI trovate nelle versioni più recenti di GDAL in modo che non sia necessario leggere l'intero file in memoria o su disco. Inoltre, i bucket che utilizziamo non sono sempre pubblici, quindi molti dei trucchi HTTP pubblicati non funzioneranno in molte delle nostre situazioni.