Questa risposta descrive un metodo oggettivo per misurare discrepanze arbitrarie tra due set di dati spaziali. Tali discrepanze possono includere spostamenti di posizione, cambiamenti di forma e caratteristiche presenti in un set di dati ma non in un altro. Questa risposta non fornisce alcun mezzo per determinare quale sia "migliore", perché dipende molto più dai semplici dati e dipende in particolare da ciò che i dati verranno utilizzati.
sfondo
Una buona base per un ampio set di tali misurazioni si basa sulla trasformazione euclidea della distanza di ciascun set di dati. In questo modo ogni set di dati rappresenta una raccolta di punti nel piano. Chiamiamo queste raccolte B per le caratteristiche blu e R per le caratteristiche rosse.
Per ogni punto x nel piano, la distanza euclidea trasformata di un set di punti A calcola l'estremo inferiore delle distanze fra x e A . Si può pensare a questa trasformazione, come la creazione di una "superficie" la cui altezza x è uguale alla distanza più breve da x a A . Così questa superficie ha valli in tutti i punti A , dove la sua altezza è zero, e sorge a 1: 1 pendenza distanti A . È chiaro che la trasformazione della distanza a sua volta determina A (o tecnicamente la sua chiusura metrica , che per i set di dati GIS è la stessa di A) come l'insieme di tutti i punti a un'altezza zero. Pertanto la trasformazione della distanza cattura completamente tutte le informazioni spaziali di A che il GIS è in grado di rappresentare.
Questa figura mostra le trasformazioni della distanza di B (a sinistra) e R (a destra) in pseudo-rilievo.
Confronto tra due datset
Per confrontare B e R , sovrapponi ciascuno con la trasformazione della distanza dell'altro:
I valori della distanza vengono visualizzati come colori graduati da blu (vicino a 0) a rossi.
Mappa sinistra, per esempio, mostra i punti di B e colori secondo le loro distanze da R . I ruoli di B e R vengono cambiati nella giusta mappa.
Già questi aiutano l'occhio a fare confronti: ogni mappa mostra i punti di un set di dati e, con il suo uso del colore, enfatizza i punti che sono lontani da qualsiasi punto nell'altro set di dati. Nota che entrambe le mappe sono necessarie per il confronto, perché ognuna mostra punti non sull'altra.
Nelle mappe dettagliate, il colore può essere difficile da vedere, quindi potremmo scegliere di sfocarlo un po 'per la presentazione o la valutazione visiva:
NB: I colori non sono comparabili tra le due mappe: all'interno di ciascuna mappa sono ridimensionati per mostrare l'intera gamma di distanze in quella mappa.
Analisi statistica delle differenze
La bellezza di questo approccio sta in ciò che può essere fatto in post-elaborazione. Usando un raster per rappresentare le trasformazioni di distanza e le loro sovrapposizioni, possiamo facilmente ottenere statistiche - locali e globali - per misurare le discrepanze. Ad esempio, potremmo concentrarci su tutte le distanze più grandi di alcune piccole soglie per esplorare la loro distribuzione di frequenza:
In questo istogramma le barre blu sono per le funzioni blu, le barre rosse per le funzioni rosse. (Notare la scala logaritmica sull'asse orizzontale.) Questo istogramma mostra i dati sovrapposti originali, non i dati sfocati derivati. Ha selezionato solo quelle distanze maggiori di tre pixel nell'immagine originale.
Questi istogrammi mostrano che è molto più probabile che le funzioni blu siano distanti dalle funzioni rosse rispetto a viceversa : le barre blu sono più alte del rosso e si estendono a distanze maggiori (a destra). L'intero arsenale di statistiche descrittive è ora disponibile per quantificare le differenze tra i due set di dati. Queste statistiche possono essere applicate all'intera regione di interesse o "finestra" su di essa per esplorare in che modo i due set di dati differiscono in base alla posizione.
Implementazione
La maggior parte dei GIS raster fornisce una trasformazione a distanza euclidea (come EuclideanDistance in ArcGIS e r.grow.distance in GRASS) e tutti supportano il semplice overlay (mascheramento) necessario per eseguire questa analisi. La sfocatura, se lo si desidera, può essere eseguita con una media di vicinato o convoluzione del kernel (che include la "sfocatura gaussiana" disponibile in tutti i software di elaborazione delle immagini). La maggior parte dei GIS non fornisce un supporto adeguato per l'analisi statistica completa dei dati raster, ma sono bravi a esportare tali dati in formati leggibili da software statistico e matematico come R
o Mathematica (che ha reso tutte le cifre qui).