Introduzione e Riepilogo
La legge della geografia di Tobler afferma
Tutto è collegato a tutto il resto, ma vicino alle cose sono più legate delle cose lontane.
Kriging adotta un modello di quelle relazioni in cui
Le "cose" sono valori numerici nelle posizioni sulla superficie terrestre (o nello spazio), generalmente rappresentate come piano euclideo.
Si presume che questi valori numerici siano realizzazioni di variabili casuali.
"Correlato" è espresso in termini di mezzi e covarianze di queste variabili casuali.
(Una raccolta di variabili casuali associate a punti nello spazio è chiamata "processo stocastico"). Il variogramma fornisce le informazioni necessarie per calcolare quelle covarianze.
Che cos'è Kriging
Kriging in particolare è la previsione di cose in luoghi in cui non sono state osservate. Per rendere matematicamente trattabile il processo di previsione, Kriging limita le possibili formule alle funzioni lineari dei valori osservati. Ciò rende il problema un problema finito nel determinare quali dovrebbero essere i coefficienti. Questi possono essere trovati richiedendo che la procedura di previsione abbia determinate proprietà. Intuitivamente, una proprietà eccellente è che le differenze tra il predittore e il valore vero (ma sconosciuto) dovrebbero tendere ad essere piccole: cioè, il predittore dovrebbe essere preciso . Un'altra proprietà molto pubblicizzata ma più discutibile è che in media il predittore dovrebbe eguagliare il valore reale: dovrebbe essere accurato .
(Il motivo per cui insistere sulla perfetta accuratezza è discutibile - ma non necessariamente negativo - è che di solito rende meno precisa una procedura statistica: vale a dire, più variabile. Quando si spara ad un bersaglio, si preferisce sparpagliare uniformemente i colpi attorno al bordo e colpire raramente il centro o accetteresti risultati focalizzati proprio accanto, ma non esattamente sul centro? Il primo è preciso ma impreciso mentre il secondo è impreciso ma preciso.)
Questi presupposti e criteri - che mezzi e covarianze sono modi appropriati per quantificare la relazione, che una previsione lineare funzionerà e che il predittore dovrebbe essere il più preciso possibile soggetto a essere perfettamente accurati - portano a un sistema di equazioni che ha un soluzione unica a condizione che le covarianze siano state specificate in modo coerente . Il predittore risultante è quindi chiamato "BLUP": miglior predittore lineare non distorto.
Dove arriva il Variogram
Per trovare queste equazioni è necessario rendere operativo il programma appena descritto. Questo viene fatto scrivendo le covarianze tra il predittore e le osservazioni considerate variabili casuali. L' algebra delle covarianze fa sì che le covarianze tra i valori osservati entrino anche nelle equazioni di Kriging.
A questo punto raggiungiamo un vicolo cieco, perché quelle covarianze sono quasi sempre sconosciute. Dopotutto, nella maggior parte delle applicazioni abbiamo osservato solo una realizzazione di ciascuna delle variabili casuali: vale a dire il nostro set di dati, che costituisce solo un numero in ogni posizione distinta. Inserisci il variogramma: questa funzione matematica ci dice quale dovrebbe essere la covarianza tra due valori qualsiasi. È vincolato a garantire che queste covarianze siano "coerenti" (nel senso che non fornirà mai un insieme di covarianze matematicamente impossibili: non tutte le raccolte di misure numeriche di "parentela" formeranno vere e proprie matrici di covarianza ). Ecco perché un variogramma è essenziale per Kriging.
Riferimenti
Poiché alla domanda immediata è stata data una risposta, mi fermo qui. I lettori interessati possono imparare come vengono stimati e interpretati i vari diagrammi consultando buoni testi come Mining Geostatistics di Journel & Huijbregts (1978) o Applied Geostatistics (1989) di Isaaks & Srivastava . (Si noti che il processo di stima introduce due oggetti chiamati "variogrammi": un variogramma empirico derivato da dati e un modello vario che è adattato ad esso. Tutti i riferimenti a "variogramma" in questa risposta sono al modello. La chiamata a vgm
nella domanda restituisce una rappresentazione al computer di un modello di variogramma.) Per un approccio più moderno in cui la stima del variogramma e Kriging sono opportunamente combinati, vedere Diggle &Geostatistica basata sui modelli (2007) (che è anche un manuale esteso per i R
pacchetti GeoR
e GeoRglm
).
Commenti
Per inciso, se stai usando Kriging per la previsione o qualche altro algoritmo, la caratterizzazione quantitativa della correlazione offerta dal variogramma è utile per valutare qualsiasi procedura di previsione. Si noti che tutti i metodi di interpolazione spaziale sono predittori da questo punto di vista - e molti di essi sono predittori lineari, come IDW (Inverse Distance Weighted). Il variogramma può essere utilizzato per valutare il valore medio e la dispersione (deviazione standard) di uno qualsiasi dei metodi di interpolazione. Quindi ha applicabilità ben oltre il suo uso in Kriging.
gstat
pacchetto R degli stessi dati di meuse.