Come funziona l'Interpolazione di Kriging?


10

Sto lavorando a un problema in cui è necessario utilizzare Kriging per prevedere il valore di alcune variabili in base ad alcune variabili circostanti. Voglio implementare il suo codice da solo. Quindi, ho esaminato troppi documenti per capire come funziona, ma ero così confuso. In generale, capisco che si tratta di una media ponderata, ma non sono riuscito a comprendere completamente il processo di calcolo del peso, quindi prevedere il valore di una variabile.

Qualcuno può spiegarmi in termini semplici gli aspetti matematici di questi metodi interpolati e come funziona?


3
L'implementazione del codice è un ottimo strumento di apprendimento ma non può essere raccomandato per lavorare su problemi reali. Una volta che avrai scritto, debug e testato il codice, scoprirai che ha bisogno di un ordine di grandezza maggiore sforzo per fornire strumenti supplementari per l'analisi dei dati esplorativi spaziali, la variografia, la convalida incrociata del variogramma, la ricerca di vicinato e il post- elaborazione dei risultati kriged. Un compromesso ragionevole ed efficace sarebbe iniziare con un codice funzionante, come GSLib o GeoRGLM , e modificarlo.
whuber

Grazie mille, è un'ottima idea, ma voglio anche capire l'aspetto matematico di Kriging, hai una risorsa che lo spiega chiaramente in termini semplici? Grazie.
Dania,

Risposte:


15

Questa risposta consiste in una sezione introduttiva che ho scritto di recente per un articolo che descrive un'estensione (modesta) spazio-temporale di "Universal Kriging" (Regno Unito), che a sua volta è una modesta generalizzazione di "Ordinary Kriging". Ha tre sottosezioni: la teoria fornisce un modello statistico e ipotesi; La stima rivede brevemente la stima dei parametri dei minimi quadrati; e Prediction mostra come il kriging si adatta al framework Generalized Least Squares (GLS). Ho fatto uno sforzo per adottare una notazione familiare agli statistici, in particolare i visitatori di questo sito, e per usare concetti che sono ben spiegati qui.

Per riassumere, kriging è la migliore previsione lineare non polarizzata (BLUP) di un campo casuale. Ciò significa che il valore previsto in qualsiasi posizione non campionata viene ottenuto come una combinazione lineare dei valori e delle covariate osservate nelle posizioni campionate. Il valore (sconosciuto, casuale) lì ha una presunta correlazione con i valori del campione (e i valori del campione sono correlati tra loro). Queste informazioni di correlazione vengono prontamente tradotte nella varianza della previsione. Si scelgono i coefficienti nella combinazione lineare (i "pesi di kriging") che rendono questa varianza quanto più piccola possibile, soggetta a una condizione di bias zero nella previsione. I dettagli seguono.


Teoria

Il Regno Unito comprende due procedure - una di stima e l'altra di previsione - eseguite nel contesto di un modello GLS per un'area di studio. Il modello GLS suppone che i dati campione siano il risultato di deviazioni casuali attorno a una tendenza e che tali deviazioni siano correlate. Una tendenza è intesa nel senso generale di un valore che può essere determinato da una combinazione lineare di coefficienti sconosciuti (parametri) . (In tutto questo post, il primo indica la trasposizione della matrice e tutti i vettori sono considerati vettori di colonna.)zi, (i=1,2,...,n)pβ=(β1,β2,,βp)

In qualsiasi posizione all'interno di un'area di studio è disponibile una tupla di attributi numerici definiti "variabili indipendenti" o "covariate". (In genere è un "termine costante", e possono essere coordinate spaziali e l'ulteriore può rappresentare informazioni spaziali e altre informazioni accessorie disponibili in tutte le posizioni nell'area di studio, come la porosità di un falda acquifera o distanza da un pozzo di pompaggio.) In ciascuna posizione dei dati , oltre alle sue covariate , l'osservazione associatay 1 = 1 y 2 y 3 y i i y i = ( y i 1 , y i 2 , , y i p ) z i Z i y i y i Z iy=(y1,y2,,yp)y1=1y2y3yiiyi=(yi1,yi2,,yip)'zioè considerata una realizzazione di una variabile casuale . Al contrario, sono considerati valori determinati o caratterizzanti i punti o le piccole regioni rappresentate dalle osservazioni (i dati "supportano"). Gli non sono considerati realizzazioni di variabili casuali e devono essere indipendenti dalle proprietà di qualsiasi .ZioyioyioZio

La combinazione lineare esprime il valore atteso di Z i in termini di parametri β , che è il valore dell'andamento nella posizione i . Il processo di stima utilizza i dati per trovare i valori beta io che rappresentano i parametri incogniti ß i

E[Zio]=y'ioβ=yio1β1+yio2β2++yiopβp
Zioβioβ^ioβio, mentre il processo di previsione utilizza i dati nelle posizioni per calcolare un valore in una posizione non campionata, che è qui indicizzata come i = 0 . Gli obiettivi della stima sono parametri fissi ( cioè non casuali) mentre l'obiettivo della previsione è casuale, poiché il valore z 0 include una fluttuazione casuale attorno alla sua tendenza y 0 β . In genere, le previsioni vengono effettuate per più posizioni utilizzando gli stessi dati variando la posizione 0i=1,2,,ni=0z0y0β0. Ad esempio, vengono spesso fatte previsioni per mappare una superficie lungo una griglia regolare di punti adatta per il contorno.

Stima

Il kriging classico presuppone le fluttuazioni casuali valori previsti pari a zero e le loro covarianze sono note. Scrivi la covarianza tra Z i e Z j come c i j . Usando questa covarianza, la stima viene eseguita usando GLS. La sua soluzione è la seguente: β = H z , H = ( Y ' C - 1 Y ) - 1 Y ' C - 1 dove z = ( z 1ZiZiZjcij

β^=Hz, H=(YC1Y)1YC1
è il n -vettore delle osservazioni, Y = ( y i j ) (la “matrice di progettazione”) è lamatrice n per p le cui righe sono i vettori y i , 1 i n , e C = ( c i j ) è lamatrice di covarianza n -by- n che si presume sia invertibile (Draper & Smith (1981), sezione 2.11). Ilz=(z1,z2,,zn)nY=(yij)npyi,1inC=(cij)nn da n matrice H , che proietta i dati z sul parametro stime p , è detta “matrice cappello”. La formulazione della β come l'applicazione della matrice cappello ai dati esplicitamente mostra come la stima dei parametri dipendono linearmente sui dati. Le covarianze C = ( c i j ) sono calcolate classicamente usando un variogramma che fornisce la covarianza in termini di posizioni dei dati, sebbene non sia significativo il modo in cui la covarianza viene effettivamente calcolata.pnHzβ^β^C=(cij)

Predizione

UK predice simile mediante una combinazione lineare dei dati z 0 = λ 1 z 1 + λ 2 z 2 + + λ n z n = λ ' z . I λ i sono chiamati "pesi di kriging" per la previsione di z 0 . Il Regno Unito realizza questa previsione di z 0 soddisfacendo due criteri. Innanzitutto, la previsione dovrebbe essere imparziale, che viene espressa richiedendo che la combinazione lineare delle variabili casualiz0

z^0=λ1z1+λ2z2++λnzn=λ'z.
λioz0z0 è uguale a Z 0 in media: 0 = E [ Z 0 - Z 0 ] = E [ λ ' Z - Z 0 ] . Questa aspettativa è presa sulladistribuzione variabile n + 1 di Z 0 e Z = ( Z 1 , Z 2 , , Z n )ZioZ0
0=E[Z^0-Z0]=E[λ'Z-Z0].
n+1Z0Z=(Z1,Z2,...,Zn). La linearità di aspettativa insieme all'assunzione di tendenza (1) implica:
0=E[λZZ0]=λE[Z]E[Z0]=λ(Yβ)y0β=(λYy0)β=β(Yλy0)

β

Y^'λ=y0.

λZ^0-Z0

Vun'r(Z^0-Z0)=E[(Z^0-Z0)2]=E[(λ'Z-Z0)2]=c00-2λ'c0+λ'Cλ
c0=(c01,c02,...,c0n)'Z0Zio, io1c00Z0

λpμY^'λ=y0n+p

(CYY0)(λμ)=(c0y0)
0pp1nnλ
λ=Hy0+C1(1YH)c0.

(I lettori che hanno familiarità con la regressione multipla possono trovare istruttivo confrontare questa soluzione con la soluzione basata sulla covarianza delle equazioni normali dei minimi quadrati ordinari , che sembra quasi esattamente la stessa, ma senza termini moltiplicatori di Lagrange.)

λ[Hy0]Z0z^0


1
Grazie mille whuber, questo è esattamente quello che sto cercando. Hai risolto questo problema per me, ora capisco Kriging. Apprezzo molto il tuo aiuto, grazie mille.
Dania,

Y^'

Y=(yji)pnyi,1in
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.