Confusione riguardo al kriging


9

Stavo leggendo questo articolo di Wikipedia relativo a Kriging. Non ho capito la parte quando lo dice

Kriging calcola il miglior stimatore lineare imparziale, , di tale che la varianza di kriging sia minimizzata con la condizione di imparzialità. Non ho ottenuto la derivazione e anche il modo in cui la varianza è ridotta al minimo. Eventuali suggerimenti?Z(x0)Z^(x0)Z(x0)

In particolare, non ho ottenuto la parte in cui si applica minimizzata a condizione di imparzialità.

Penso che avrebbe dovuto essere

E [Z '(x0) -Z (x0)] invece di E [Z' (x) -Z (x)] non è vero. 'equivale a hat nell'articolo wiki. Inoltre non ho capito come viene derivato l'errore kriging


Dove rimani bloccato nella derivazione?
whuber

La parte in cui calcola l'errore di kriging e impone la condizione di imparzialità. Va bene dire che condizione imparziale significa l'attesa dello stimatore e quella vera è uguale. Ho modificato il post per includere i dettagli.
user31820

Penso che tu abbia ragione nel dire che l'espressione di Wikipedia dovrebbe leggere . E[Z(x0)Z(x0)]
whuber

Risposte:


13

Supponiamo che sia un vettore che si presume abbia una distribuzione multivariata di media sconosciuta e nota matrice varianza-covarianza . Osserviamo da questa distribuzione e desideriamo prevedere da queste informazioni usando un predittore lineare imparziale: (μ,μ,,μ)Σ ( z 1 , z 2 , , z n ) z 0(Z0,Z1,,Zn)(μ,μ,,μ)Σ(z1,z2,,zn) z0

  • Lineare significa che la previsione deve assumere la forma per determinare i coefficienti . Questi coefficienti possono dipendere al massimo da ciò che è noto in anticipo: vale a dire, le voci di .λiΣz0^=λ1z1+λ2z2++λnznλiΣ

Questo predittore può anche essere considerato una variabile casuale .Z0^=λ1Z1+λ2Z2++λnZn

  • Non distorto significa che l'aspettativa di uguale alla sua media (sconosciuta) . μZ0^μ

La scrittura delle cose fornisce alcune informazioni sui coefficienti:

μ=E[Z0^]=E[λ1Z1+λ2Z2++λnZn]=λ1E[Z1]+λ2E[Z2]++λnE[Zn]=λ1μ++λnμ=(λ1++λn)μ.

La seconda riga è dovuta alla linearità delle aspettative e tutto il resto è una semplice algebra. Poiché si suppone che questa procedura funzioni indipendentemente dal valore di , evidentemente i coefficienti devono riassumere in unità. Scrivendo i coefficienti nella notazione vettoriale , questo può essere ben scritto .λ = ( λ i ) 1 λ = 1μλ=(λi)1λ=1

Tra l'insieme di tutti questi predittori lineari imparziali, ne cerchiamo uno che devia il meno possibile dal valore reale possibile , misurato nel quadrato della media della stanza. Anche questo è un calcolo. Si basa sulla bilinearità e sulla simmetria della covarianza, la cui applicazione è responsabile delle somme nella seconda riga:

E[(Z0^-Z0)2]=E[(λ1Z1+λ2Z2++λnZn-Z0)2]=Σio=1nΣj=1nλioλjvar[Zio,Zj]-2Σio=1nλiovar[Zio,Z0]+var[Z0,Z0]=Σio=1nΣj=1nλioλjΣio,j-2Σio=1nλioΣ0,io+Σ0,0.

Da qui i coefficienti possono essere ottenuti minimizzando questa forma quadratica soggetta al vincolo (lineare) . Questo è facilmente risolto usando il metodo dei moltiplicatori di Lagrange, producendo un sistema lineare di equazioni, le "equazioni di Kriging".1λ=1

Nell'applicazione, è un processo stocastico spaziale ("campo casuale"). Ciò significa che per ogni dato set di posizioni fisse (non casuali) , il vettore dei valori di in quelle posizioni, è casuale con una sorta di distribuzione multivariata. Scrivere e applicare la precedente analisi, assumendo i mezzi di processo in ogni posizioni sono uguali e assumendo la matrice di covarianza dei valori di processo a questi località è conosciuta con certezza.x 0 , , x n Z ( Z ( x 0 ) , , Z ( x n ) ) Z i = Z ( x i ) n + 1 x i n + 1ZX0,...,XnZ(Z(X0),...,Z(Xn))Zio=Z(Xio)n+1Xion+1

Interpretiamo questo. In base alle ipotesi (compresa la media costante e la covarianza nota), i coefficienti determinano la varianza minima raggiungibile da qualsiasi stimatore lineare. Chiamiamo questa varianza ("OK" è per "kriging ordinario"). Dipende esclusivamente dalla matrice . Ci dice che se dovessimo campionare ripetutamente da e usare questi coefficienti per prevedere ogni volta i valori dai valori rimanenti, allora Σ ( Z 0 , , Z n ) z 0σOK2Σ(Z0,...,Zn)z0

  1. In media le nostre previsioni sarebbero corrette.

  2. In genere, le nostre previsioni di si discostano di circa dai valori effettivi di .σ O K z 0z0σOKz0

C'è ancora molto da dire prima che questo possa essere applicato a situazioni pratiche come la stima di una superficie da dati puntuali: abbiamo bisogno di ulteriori ipotesi su come le caratteristiche statistiche del processo spaziale variano da una posizione all'altra e da una realizzazione all'altra (anche se , in pratica, di solito sarà disponibile solo una realizzazione). Ma questa esposizione dovrebbe essere sufficiente per seguire come la ricerca di un "migliore" predittore lineare non distorto ("BLUP") porti direttamente a un sistema di equazioni lineari.


A proposito, il kriging come di solito praticato non è esattamente uguale alla stima dei minimi quadrati, perché è stimato in una procedura preliminare (nota come "variografia") usando gli stessi dati. Ciò è in contrasto con le ipotesi di questa derivazione, che presumeva che fosse noto (e a maggior ragione indipendente dai dati). Quindi, all'inizio, Kriging ha alcuni difetti concettuali e statistici incorporati in esso. I professionisti premurosi lo hanno sempre saputo e hanno trovato vari modi creativi per (tentare di) giustificare le incoerenze. (Avere molti dati può davvero aiutare.) Esistono ora delle procedure per la stima simultanea diΣ ΣΣΣΣe prevedere una raccolta di valori in posizioni sconosciute. Richiedono ipotesi leggermente più forti (normalità multivariata) per realizzare questa impresa.


C'è un sito web là fuori in cui il loro ragazzo si oppone al kriging e sembra che abbia alcuni punti validi. Penso che il tuo ultimo paragrafo qui sia molto illuminante.
Wayne,

@Wayne Sì, puoi dire a cosa sto reagendo. Ma sebbene il kriging sia stato usato come "olio di serpente" dai consulenti, ha molto da fare, inclusa una teoria del "cambio di supporto" per confrontare i dati ottenuti da (diciamo) piccoli campioni di un mezzo con dati ottenuti da molto più grandi porzioni di quel mezzo. Kriging alla fine è oggi alla base della più sofisticata modellistica spazio-temporale. È anche un modo utile per valutare proposte alternative: ad esempio, molti interpolatori spaziali sono lineari (o possono essere linearizzati), quindi è giusto confrontare la loro varianza di stima con quella del kriging.
whuber

1

Kriging è semplicemente la stima dei minimi quadrati per i dati spaziali. Come tale fornisce uno stimatore lineare imparziale che minimizza la somma degli errori al quadrato. Poiché è imparziale l'MSE = la varianza dello stimatore ed è un minimo.


Non ho ottenuto la parte che calcola l'errore kriging. Inoltre sono confuso con la varianza e la varianza di kriging. Qual è la differenza e qual è il loro significato
user31820

@whuber. Grazie per la spiegazione, ma non ho ottenuto la derivazione dell'equazione quando hai calcolato l'MSE del valore previsto dalla stima imparziale e dallo stimatore vero. La seconda riga deve essere specifica in tale equazione
user31820

@whuber Inoltre non ho ricevuto la parte wiki quando calcola la varianza di kriging che è simile a quella nella tua risposta. Hanno gli stessi risultati ma i termini iniziali sono diversi. Come mai?
user31820
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.