Questa risposta consiste in una sezione introduttiva che ho scritto di recente per un articolo che descrive un'estensione (modesta) spazio-temporale di "Universal Kriging" (Regno Unito), che a sua volta è una modesta generalizzazione di "Ordinary Kriging". Ha tre sottosezioni: la teoria fornisce un modello statistico e ipotesi; La stima rivede brevemente la stima dei parametri dei minimi quadrati; e Prediction mostra come il kriging si adatta al framework Generalized Least Squares (GLS). Ho fatto uno sforzo per adottare una notazione familiare agli statistici, in particolare i visitatori di questo sito, e per usare concetti che sono ben spiegati qui.
Per riassumere, kriging è la migliore previsione lineare non polarizzata (BLUP) di un campo casuale. Ciò significa che il valore previsto in qualsiasi posizione non campionata viene ottenuto come una combinazione lineare dei valori e delle covariate osservate nelle posizioni campionate. Il valore (sconosciuto, casuale) lì ha una presunta correlazione con i valori del campione (e i valori del campione sono correlati tra loro). Queste informazioni di correlazione vengono prontamente tradotte nella varianza della previsione. Si scelgono i coefficienti nella combinazione lineare (i "pesi di kriging") che rendono questa varianza quanto più piccola possibile, soggetta a una condizione di bias zero nella previsione. I dettagli seguono.
Teoria
Il Regno Unito comprende due procedure - una di stima e l'altra di previsione - eseguite nel contesto di un modello GLS per un'area di studio. Il modello GLS suppone che i dati campione siano il risultato di deviazioni casuali attorno a una tendenza e che tali deviazioni siano correlate. Una tendenza è intesa nel senso generale di un valore che può essere determinato da una combinazione lineare di coefficienti sconosciuti (parametri) . (In tutto questo post, il primo indica la trasposizione della matrice e tutti i vettori sono considerati vettori di colonna.)zi, (i=1,2,...,n)pβ=(β1,β2,…,βp)′′
In qualsiasi posizione all'interno di un'area di studio è disponibile una tupla di attributi numerici definiti "variabili indipendenti" o "covariate". (In genere è un "termine costante", e possono essere coordinate spaziali e l'ulteriore può rappresentare informazioni spaziali e altre informazioni accessorie disponibili in tutte le posizioni nell'area di studio, come la porosità di un falda acquifera o distanza da un pozzo di pompaggio.) In ciascuna posizione dei dati , oltre alle sue covariate , l'osservazione associatay 1 = 1 y 2 y 3 y i i y i = ( y i 1 , y i 2 , … , y i p ) ′ z i Z i y i y i Z iy=(y1,y2,…,yp)′y1=1y2y3yiiyi=(yi1,yi2,…,yip)′zioè considerata una realizzazione di una variabile casuale . Al contrario, sono considerati valori determinati o caratterizzanti i punti o le piccole regioni rappresentate dalle osservazioni (i dati "supportano"). Gli non sono considerati realizzazioni di variabili casuali e devono essere indipendenti dalle proprietà di qualsiasi .ZioyioyioZio
La combinazione lineare
esprime il valore atteso di Z i in termini di parametri β , che è il valore dell'andamento nella posizione i . Il processo di stima utilizza i dati per trovare i valori beta io che rappresentano i parametri incogniti ß i
E [ Zio] = y'ioβ= yio 1β1+ yi 2β2+ ⋯ + yio pβp
Zioβioβ^ioβio, mentre il processo di previsione utilizza i dati nelle posizioni
per calcolare un valore in una posizione non campionata, che è qui indicizzata come
i = 0 . Gli obiettivi della stima sono parametri fissi (
cioè non casuali) mentre l'obiettivo della previsione è casuale, poiché il valore
z 0 include una fluttuazione casuale attorno alla sua tendenza
y ′ 0 β . In genere, le previsioni vengono effettuate per più posizioni utilizzando gli stessi dati variando la posizione
0i=1,2,…,ni=0z0y′0β0. Ad esempio, vengono spesso fatte previsioni per mappare una superficie lungo una griglia regolare di punti adatta per il contorno.
Stima
Il kriging classico presuppone le fluttuazioni casuali valori previsti pari a zero e le loro covarianze sono note. Scrivi la covarianza tra Z i e Z j come c i j . Usando questa covarianza, la stima viene eseguita usando GLS. La sua soluzione è la
seguente: β = H z , H = ( Y ' C - 1 Y ) - 1 Y ' C - 1
dove z = ( z 1ZiZiZjcij
β^=Hz, H=(Y′C−1Y)−1Y′C−1
è il
n -vettore delle osservazioni,
Y = ( y i j ) (la “matrice di progettazione”) è lamatrice
n per
p le cui righe sono i vettori
y ′ i , 1 ≤ i ≤ n , e
C = ( c i j ) è lamatrice di covarianza
n -by-
n che si presume sia invertibile (Draper & Smith (1981), sezione 2.11). Il
z=(z1,z2,…,zn)nY=(yij)npy′i,1≤i≤nC=(cij)nn da
n matrice
H , che proietta i dati
z sul parametro stime
p , è detta “matrice cappello”. La formulazione della
β come l'applicazione della matrice cappello ai dati esplicitamente mostra come la stima dei parametri dipendono linearmente sui dati. Le covarianze
C = ( c i j ) sono calcolate classicamente usando un variogramma che fornisce la covarianza in termini di posizioni dei dati, sebbene non sia significativo il modo in cui la covarianza viene effettivamente calcolata.
pnHzβ^β^C=(cij)
Predizione
UK predice simile mediante una combinazione lineare dei dati
z 0 = λ 1 z 1 + λ 2 z 2 + ⋯ + λ n z n = λ ' z .
I λ i sono chiamati "pesi di kriging" per la previsione di z 0 . Il Regno Unito realizza questa previsione di z 0 soddisfacendo due criteri. Innanzitutto, la previsione dovrebbe essere imparziale, che viene espressa richiedendo che la combinazione lineare delle variabili casualiz0
z^0= λ1z1+ λ2z2+ ⋯ + λnzn= λ'z .
λioz0z0 è uguale a
Z 0 in media:
0 = E [ Z 0 - Z 0 ] = E [ λ ' Z - Z 0 ] .
Questa aspettativa è presa sulladistribuzione variabile
n + 1 di
Z 0 e
Z = ( Z 1 , Z 2 , … , Z n )ZioZ00 = E [ Z^0- Z0] = E [ λ'Z - Z0] .
n + 1Z0Z =( Z1, Z2, ... , Zn). La linearità di aspettativa insieme all'assunzione di tendenza (1) implica:
0= E [ λ'Z - Z0] = λ'E [ Z ]- E [ Z0] = λ'( Y β) - y'0β=(λ′Y−y′0)β=β′(Y′λ−y0)
β
Y^'λ = y0.
λZ^0- Z0
V a r ( Z^0- Z0) = E [ ( Z^0- Z0)2] = E [ ( λ'Z - Z0)2] = c00- 2 λ'c0+ λ'C λ
c0= ( c01, c02, ... , c0 n)'Z0Zio, i ≥ 1 c00Z0
λpμY^'λ = y0n + p
( CY'Y0) ( λμ)=(c0y0)
0pp1nnλλ = H'y0+ C- 1(1−YH)c0.
(I lettori che hanno familiarità con la regressione multipla possono trovare istruttivo confrontare questa soluzione con la soluzione basata sulla covarianza delle equazioni normali dei minimi quadrati ordinari , che sembra quasi esattamente la stessa, ma senza termini moltiplicatori di Lagrange.)
λ[H′y0]Z0z^0