Quando si ha a che fare con raster di risoluzioni diverse si dovrebbe ricampionare alla risoluzione più alta o più bassa?


16

Sto cercando consigli sulle migliori pratiche per gestire i livelli di dati raster con diverse risoluzioni e proiezioni. Il consiglio che mi è stato dato è di ricampionare sempre al livello con la risoluzione più bassa prima di eseguire qualsiasi analisi, ma questo mi sembra un enorme spreco di precisione e non mi è mai stata data una solida spiegazione del perché dovrebbe essere fatto.

Quando è ragionevole ricampionare per abbinare una griglia a risoluzione più elevata e quali sono le implicazioni rispetto al ricampionamento a una risoluzione inferiore?

Mi rendo conto che ciò dipende molto dalla situazione. Sono principalmente alla ricerca di linee guida generali, ma ecco il mio scenario specifico di riferimento:

Scenario: sto cercando di costruire un modello di regressione spaziale che preveda l'uso del suolo basato su una varietà di strati ambientali e socio-economici. La mia mappa dell'uso del suolo è derivata da Landsat e quindi con una risoluzione di 30 m. Esempi di strati esplicativi includono SRTM DEM (3 secondi d'arco, ~ 90 m) e strati climatici Bioclim (30 secondi d'arco, ~ 1 km).


1
Potresti fornire maggiori informazioni sul modello di regressione e sul metodo di implementazione? +1 per una domanda ben costruita e interessante!
Aaron

Sto confrontando la copertura forestale in due punti nel tempo e sto usando un modello di regressione logistica con la probabilità (binaria) di deforestazione come mia risposta. Lo implementerò in R.
Matt SM,

Risposte:


17

In realtà non dipende tutto da quella situazione ed è tutto basato sull'errore statistico.

Ogni volta che ricampi ad una risoluzione più alta, stai introducendo una falsa precisione. Considera un insieme di dati misurati in piedi solo a numeri interi. Ogni dato punto può trovarsi a +/- 0,5 piedi dalla sua posizione attuale. Se ricampi al decimo più vicino, ora stai dicendo che un dato numero non è più di +/- 0,1 dalla sua posizione attuale. Tuttavia, sai che le tue misure originali non erano così accurate e ora stai operando entro il margine di errore. Tuttavia, se si va dall'altra parte e si ricampiona alla risoluzione più bassa, si sa che ogni dato valore in punti è sicuramente accurato perché è contenuto nel margine di errore del campione più ampio.

Al di fuori della matematica statistica, il primo posto che viene in mente è il rilevamento del territorio. I sondaggi più vecchi hanno specificato solo i cuscinetti fino al mezzo minuto più vicino e le distanze al decimo di piede. Tracciare una traversata di confine con queste misurazioni può spesso portare a una chiusura errata (il punto iniziale e il punto finale devono essere uguali ma non vengono misurati) in piedi. I sondaggi moderni vanno almeno al secondo e al centesimo di piede più vicini. I valori derivati ​​(come l'area di un lotto) possono essere significativamente influenzati dalla differenza di precisione. Il valore derivato stesso può anche essere dato come eccessivamente preciso.

Nel tuo caso di analisi, se ricampi ad una risoluzione più alta i tuoi risultati implicheranno una precisione molto maggiore rispetto ai dati su cui si basano. Considera il tuo SRTM a 90m. Con qualunque metodo misurino l'elevazione (avg / max / mean return), l'unità più piccola (pixel) che può essere differenziata dai suoi vicini è 90m. Se lo ricampi a 30m, o:

  • supponi che tutti e nove i pixel risultanti abbiano la stessa elevazione quando in verità forse solo uno - il centro, o in alto a sinistra - (o nessuno!) è
  • si interpola tra i pixel, creando valori derivati ​​non presenti prima

Pertanto, in entrambi i casi si introduce una falsa precisione perché i nuovi sottocampioni non sono stati effettivamente misurati.

Domanda correlata: quali pratiche sono disponibili per modellare l'idoneità del terreno?


Questo vale sicuramente per i dati puntuali. Ma mi chiedo se è diverso per i dati raster che fanno una media di una quantità spaziale in continua variazione dove c'è precisione di posizione e precisione della quantità misurata. Inoltre, quantità diverse hanno livelli diversi di variazione spaziale. Ad esempio, il ricampionamento dei dati di elevazione a una risoluzione più elevata deve introdurre più errori nelle aree montuose rispetto alle praterie.
Matt SM,

@MattSM È vero per tutti i dati spaziali e aggravato dall'errore statistico della quantità misurata. Considera la tua SRTM a 90m. Con qualunque metodo misurino l'elevazione (avg / max / mean return), l'unità più piccola (pixel) che può essere differenziata dai suoi vicini è 90m. Se lo ricampi a 30m, ora stai dicendo che tutti e 9 i pixel risultanti hanno la stessa elevazione quando in verità forse solo uno (o nessuno!) È - il centro, o in alto a sinistra. Oppure interpoli tra i pixel, creando valori non presenti prima, quindi falsa precisione. E sì, l'intervallo di valori riproduce il potenziale errore.
Chris W,

Proprio come una nota a margine è possibile interpolare caratteristiche specifiche in casi speciali in cui il modello è chiaramente limitato: una caratteristica, non geografica, che viene in mente sta ricostruendo le informazioni sulla targa da fotografie che hanno una risoluzione troppo bassa da leggere. Ma devi sapere cosa stai guardando Ricordo alcuni casi in cui la ricostruzione della targa non è riuscita perché la targa in questione era in una scrittura non europea come l'arabo.
Steve Barnes,

Che dire dei raster con risoluzione basata sull'arco, non hanno celle a griglia che potrebbero essere di aree / proporzioni diverse in aree diverse?
CMCDragonkai,

@CMCDragonkai Non sono sicuro di come affrontarlo perché stai entrando nella rappresentazione dei dati rispetto al formato e ai sistemi di coordinate / proiezioni. Sì, l'area geografica di un raster non è necessariamente uniforme come i pixel quadrati (o altri formati). Molte specifiche dei dati satellitari ti diranno questo (il pixel è x ​​su nadir e y sul bordo dell'andana). Ma i problemi di ricampionamento si applicano ancora - semmai aggrava il problema. (E scusate il ritardo, non sono stato a SE da un po 'di tempo.)
Chris W,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.