Numero minimo di campioni per l'interpolazione di kriging


19

Ottengo alcuni dati con il numero di campioni con una richiesta di interpolazione usando il metodo kriging.
Dopo alcune indagini è emerso che i risultati di kriging (eseguiti nell'analista geostatistico di ArcGIS con parametri predefiniti) non sono soddisfacenti. I valori interpolati sono molto diversi dalle misurazioni (specialmente quelle più alte) e la superficie non sembra affidabile. Ecco l'immagine: inserisci qui la descrizione dell'immagine
suppongo che il problema principale sia un numero insufficiente di campioni.

Quanti punti dovremmo usare per ottenere risultati affidabili?
O forse il metodo kriging non è appropriato per valori così diversificati?


Hai detto che "Sebbene le persone abbiano ottenuto con successo fino a sette punti dati (in una monografia di Robert Jernigan pubblicata dall'EPA degli Stati Uniti alla fine degli anni '80), ...". Ma non riesco a trovare questo articolo. Puoi dare un indirizzo aperto per questo articolo? Grazie ...
abilici il

Risposte:


30

Quando usi "valori predefiniti" non stai veramente kriging, stai solo applicando l'algoritmo kriging - che come hai trovato, è scarso se usato con questi dati.

(Farò un salto su una soapbox per un breve resoconto: a mio avviso, il modo più veloce per ottenere risultati negativi con un programma per computer è accettare i suoi parametri predefiniti. ArcGIS è uno degli ambienti più ricchi e potenti per ottenere risultati negativi La morale è non usare il software per lavori importanti fino a quando non si capisce come controllarlo. Giù dalla soapbox ora ...)

Affinché kriging funzioni, è necessario condurre un'intensa analisi statistica preliminare dei dati noti come "variografia". Quanto bene alla fine questo dipende dai dati e dalle tue abilità geostatistiche. (Sono stati scritti interi libri sulla variografia, tra cui la seminale Geostatistics sulle miniere di Journel & Huijbregts e Variowin di Yvan Pannatier.) Sebbene le persone abbiano ottenuto con successo fino a sette punti dati (in una monografia di Robert Jernigan pubblicata dall'EPA USA nella fine anni '80), e in linea di principio puoi krige usando solo due o tre punti (l'ho fatto per dimostrare l'algoritmo ), le regole empiriche nella letteratura vanno da un minimo di 20 punti a 100 punti e il consenso sembra essere di circa 30 punti.

Nel tuo caso - anche se non descrivi i dati - hai alcuni chiari problemi, tra cui una distribuzione fortemente distorta e una netta mancanza di prove di stazionarietà. Questi richiedono un trattamento statistico speciale o forme specializzate di kriging (come un modello lineare generalizzato spaziale). Non otterrai buoni risultati quando credi questi dati finché non hai una grande quantità di dati.

La legenda suggerisce che potresti provare a creare una griglia di densità piuttosto che interpolare effettivamente i dati: sebbene i risultati delle due procedure possano sembrare uguali, fanno cose nettamente diverse e hanno interpretazioni nettamente diverse. È interpolare quando i dati sono considerati i campioni da qualche ipotetica superficie continua. L'interpolazione prevede i valori non campionati. Esempi standard includono misure di elevazione (che campionano la superficie terrestre) e misure di temperatura (che campionano un "campo di temperatura"). Si calcola una densità quando si hanno informazioni complete sull'importodi qualcosa e desideri rappresentare una versione livellata di tale importo per unità di area. (Contrariamente all'interpolazione, non esistono valori non campionati da prevedere.) L'esempio standard è una densità di popolazione: i dati sono conteggi di tutti gli individui all'interno di un'area; l'output è una mappa della densità di popolazione.


6
Ottima risposta @whuber. Tuttavia, il numero minimo di punti non dipende anche parzialmente dall'estensione del dominio spaziale e dalla granulometria desiderata della previsione? Se lo distillate fino a un problema di campionamento, allora si tratta di catturare la popolazione e le variazioni spaziali nel campione.
Jeffrey Evans,

@Jeffrey Questo è in parte il caso. La quantità di dati dipende da due aspetti: la varianza della previsione di kriging (che varia attraverso il dominio spaziale) e l'accuratezza con cui il variogramma stesso può essere stimato. Quest'ultimo è spesso trascurato, specialmente nei trattamenti tradizionali del kriging: è una specie di elefante nella stanza. Se conosci il variogramma corretto e ha un piccolo rapporto pepita / davanzale e un ampio intervallo rispetto all'estensione del dominio spaziale, puoi krige con dati notevolmente pochi, specialmente se campionano adeguatamente l'intera gamma di valori di dati.
whuber

3
Sono convinto che chiunque utilizzi il kriging dovrebbe aver bisogno di un buon corso di geostatistica o di un solido background GIS / statistiche. Appoggiarsi a come modellare correttamente un semivariogramma richiede alcune abilità.
Mike T,

1
La regola empirica che mi è stata richiesta: 30 punti per Kriging onnidirezionale e 100 per bidirezionale.
jareks,

1

Esistono due domande distinte, prima il numero di posizioni dei dati da utilizzare nella stima / modellizzazione del variogramma e in secondo luogo il numero di posizioni dei dati da utilizzare nelle equazioni di kriging per interpolare il valore in una posizione non di dati (o per stimare il valore medio su una regione). Supponendo che tu stia utilizzando un quartiere di ricerca in movimento, più di 15-20 posizioni di dati nel quartiere probabilmente degraderanno i risultati perché (1) solo le posizioni di dati più vicine nel quartiere di ricerca avranno pesi diversi da zero, (2) con più dati posizioni la dimensione della matrice da invertire è maggiore e la possibilità di un aumento della matrice mal condizionato. Il numero totale di posizioni dei dati necessarie per kriging dipende dal numero di posizioni da interpolare e dai modelli spaziali di quei punti e anche dalle posizioni dei dati. In breve,

Per quanto riguarda la stima / modellizzazione del variogramma, si tratta di un problema molto diverso, vedi ad esempio

1991, Myers, DE, Sulla stima del Variogram negli Atti della Prima Inter. Conf. Statistica. Comp., Cesme, Turchia,

30 marzo-2 aprile 1987, volume II, American Sciences Press, 261-281

1987, A. Warrick e DE Myers, ottimizzazione delle posizioni di campionamento per i calcoli del Variogram Ricerca delle risorse idriche 23, 496-500

Questi possono essere scaricati da www.u.arizona.edu/~donaldm

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.