Come creare una mappa degli errori per supportare una mappa della densità del kernel media?


10

Ho creato una mappa di densità del kernel media eseguendo KDE su punti impilati all'interno della stessa estensione spaziale. Ad esempio, supponiamo di avere shapefile a tre punti che rappresentano piantine in tre diversi spazi nella foresta della stessa forma e dimensione. Ho eseguito un KDE per ogni shapefile punto. L'uscita dal KDE sono stati poi impilati riferiscono estensione spaziale per calcolare la media di calcolatrice raster di arco, per esempio: Float(("KDE1"+"KDE2"+"KDE3")/3). Ecco il prodotto finale:

inserisci qui la descrizione dell'immagine

Ora sono interessato a creare una mappa che descriva l'errore associato ai KDE medi. Spero di utilizzare la mappa degli errori per rappresentare visivamente la quantità di errore associata agli hotspot (ad es. L'hotspot SW è interamente dovuto ai punti in un gap?). Come devo fare per creare una mappa dell'errore associato ai KDE mediati? Sarebbe MSE essere la più appropriata misura di errore in questo caso?


3
È un'analisi molto interessante. Cosa intendi con "errore standard"? Qualche tipo di deviazione (differenza) per ogni mappa di densità dal livello "medio"?
Analisi del paesaggio

@ Analisi del paesaggio Post modificato per indirizzare i commenti. Sì, sto pensando che una stima MSE potrebbe essere più appropriata in questo caso. In sostanza, mostra come ogni KDE differisce dal KDE medio. Non sono sicuro di come mettere tutto insieme usando ArcGIS e / o gli script.
Aaron

Risposte:


8

Un avvertimento

Un errore standard è un modo utile per stimare un'incertezza dai dati campionati quando non vi è un errore sistematico nei dati. Questa ipotesi è di dubbia validità in questo contesto, perché (a) le mappe di KDE avranno localmente errori definiti che possono persistere sistematicamente tra i livelli e (b) una componente potenzialmente enorme di incertezza dovuta alla scelta del raggio del kernel (o "larghezza di banda" ") non si rifletterà affatto in nessuna delle raccolte di queste mappe.

Alcune scelte

Tuttavia, rappresentare la variabilità tra una raccolta di mappe correlate, collocate ("impilate") è una grande idea, a patto di ricordare i limiti appena descritti. Diverse misure di variabilità locale sarebbero naturali in questo contesto, tra cui:

  • L' intervallo di valori, espresso in modo additivo (massimo meno minimo) o in modo moltiplicativo (massimo diviso per minimo).

  • La varianza o la deviazione standard dei valori. La versione moltiplicativa di questo sarebbe la varianza o la deviazione standard dei logaritmi dei valori.

  • Un robusto stimatore della dispersione, come l' intervallo interquartile (o il rapporto tra il terzo e il primo quartile).

Per molti aspetti, le misure moltiplicative possono essere più appropriate per le densità, poiché la differenza tra (diciamo) 100 e 101 alberi per acro può essere insignificante mentre la differenza tra 2 e 1 alberi per acro potrebbe essere relativamente importante. Entrambi presentano lo stesso intervallo (additivo) di 101 - 100 = 2 - 1 = 1, ma i loro intervalli moltiplicativi di 1,01 e 2,00 differiscono sostanzialmente. (Si noti che un intervallo moltiplicativo supera sempre 1, quindi 2,00 è cento volte più lontano da 1 rispetto a 1,01).

Calcolo

Il calcolo di queste misure richiede una qualche forma di statistica locale. La funzionalità di statistica delle celle in Analista spaziale calcolerà le varianze, gli intervalli e le deviazioni standard. I quantili locali possono essere trovati con rango . Piuttosto che essere pignoli su quali ranghi usare, scegli quelli convenienti vicino ai quartili. Per trovarli, sia n il numero di griglie nella pila. La mediana ha un rango di (n + 1) / 2 - che potrebbe non essere un numero intero, indicando che dovrebbe essere calcolato calcolando la media dei ranghi n / 2 e n / 2 + 1, ciascuno dei quali si avvicinerebbe alla mediana. Per approssimare i quartili, quindi, arrotondare (n + 1) / 2 fino al numero intero più vicino, quindi aggiungere nuovamente 1 e dividere per 2. Lasciare questo numero r . Usor e n + 1 - r per i ranghi dei quartili.

Ad esempio, se la pila ha n = 6 griglie, (n + 1) / 2 arrotondato per difetto è 3 e (3 + 1) / 2 = 2 non necessita di arrotondamento. Usa r = 2 e r = 6 + 1 - 2 = 5 per i gradi. In effetti, questa procedura restituirebbe il secondo valore più basso ( r = 2) e il secondo più alto ( r = 5) dei sei valori in ciascuna cella. È possibile mappare la loro differenza o il loro rapporto.


2
Immagino che il coefficiente di variazione sarebbe utile in questo contesto.
Jeffrey Evans,

1
@jeffrey Grazie, anche questa è una considerazione. Il CV si ottiene dividendo la griglia di deviazione standard (locale) per la griglia media (locale). Non ne ho parlato, ma per tali sommari moltiplicativi, si dovrebbe fare attenzione a mascherare le aree in cui il denominatore (la media o il minimo, a seconda dei casi) è vicino allo zero: i risultati potrebbero essere inaffidabili lì e probabilmente non rifletterà altro che imprecisione numerica e minuscole imprecisioni nell'approssimazione dei chicchi.
whuber

@whuber, potresti approfondire (a) nel tuo primo paragrafo? Ad esempio, ti riferisci ad errori nelle tecniche di raccolta dati che possono persistere attraverso ogni gap della foresta (e quindi manifestarsi sistematicamente in ogni raster di KDE) o errori legati all'implementazione della funzione focale?
MannyG

@whuber Grandi idee dappertutto - molte grazie!
Aaron
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.