Supponiamo che sia un vettore che si presume abbia una distribuzione multivariata di media sconosciuta e nota matrice varianza-covarianza . Osserviamo da questa distribuzione e desideriamo prevedere da queste informazioni usando un predittore lineare imparziale: (μ,μ,…,μ)Σ ( z 1 , z 2 , … , z n ) z 0( Z0, Z1, ... , Zn)( μ , μ , … , μ )Σ( z1, z2, ... , zn) z0
- Lineare significa che la previsione deve assumere la forma per determinare i coefficienti . Questi coefficienti possono dipendere al massimo da ciò che è noto in anticipo: vale a dire, le voci di .λiΣz0^= λ1z1+ λ2z2+ ⋯ + λnznλioΣ
Questo predittore può anche essere considerato una variabile casuale .Z0^= λ1Z1+ λ2Z2+ ⋯ + λnZn
- Non distorto significa che l'aspettativa di uguale alla sua media (sconosciuta) . μZ0^μ
La scrittura delle cose fornisce alcune informazioni sui coefficienti:
μ= E[ Z0^] = E[ λ1Z1+ λ2Z2+ ⋯ + λnZn]= λ1E[ Z1] + λ2E[ Z2] + ⋯ + λnE[ Zn]= λ1μ + ⋯ + λnμ= ( λ1+ ⋯ + λn) μ .
La seconda riga è dovuta alla linearità delle aspettative e tutto il resto è una semplice algebra. Poiché si suppone che questa procedura funzioni indipendentemente dal valore di , evidentemente i coefficienti devono riassumere in unità. Scrivendo i coefficienti nella notazione vettoriale , questo può essere ben scritto .λ = ( λ i ) ′ 1 λ = 1μλ = ( λio)'1 λ = 1
Tra l'insieme di tutti questi predittori lineari imparziali, ne cerchiamo uno che devia il meno possibile dal valore reale possibile , misurato nel quadrato della media della stanza. Anche questo è un calcolo. Si basa sulla bilinearità e sulla simmetria della covarianza, la cui applicazione è responsabile delle somme nella seconda riga:
E[ ( Z0^- Z0)2]= E[ ( λ1Z1+ λ2Z2+ ⋯ + λnZn- Z0)2]= ∑i = 1nΣj = 1nλioλjvar [ Zio, Zj] - 2 ∑i = 1nλiovar [ Zio, Z0] + var [ Z0, Z0]= ∑i = 1nΣj = 1nλioλjΣio , j- 2 ∑i = 1nλioΣ0 , io+ Σ0 , 0.
Da qui i coefficienti possono essere ottenuti minimizzando questa forma quadratica soggetta al vincolo (lineare) . Questo è facilmente risolto usando il metodo dei moltiplicatori di Lagrange, producendo un sistema lineare di equazioni, le "equazioni di Kriging".1 λ = 1
Nell'applicazione, è un processo stocastico spaziale ("campo casuale"). Ciò significa che per ogni dato set di posizioni fisse (non casuali) , il vettore dei valori di in quelle posizioni, è casuale con una sorta di distribuzione multivariata. Scrivere e applicare la precedente analisi, assumendo i mezzi di processo in ogni posizioni sono uguali e assumendo la matrice di covarianza dei valori di processo a questi località è conosciuta con certezza.x 0 , … , x n Z ( Z ( x 0 ) , … , Z ( x n ) ) Z i = Z ( x i ) n + 1 x i n + 1ZX0, ... , xnZ( Z( x0) , ... , Z( xn) )Zio= Z( xio)n + 1Xion + 1
Interpretiamo questo. In base alle ipotesi (compresa la media costante e la covarianza nota), i coefficienti determinano la varianza minima raggiungibile da qualsiasi stimatore lineare. Chiamiamo questa varianza ("OK" è per "kriging ordinario"). Dipende esclusivamente dalla matrice . Ci dice che se dovessimo campionare ripetutamente da e usare questi coefficienti per prevedere ogni volta i valori dai valori rimanenti, allora Σ ( Z 0 , … , Z n ) z 0σ2O KΣ( Z0, ... , Zn)z0
In media le nostre previsioni sarebbero corrette.
In genere, le nostre previsioni di si discostano di circa dai valori effettivi di .σ O K z 0z0σO Kz0
C'è ancora molto da dire prima che questo possa essere applicato a situazioni pratiche come la stima di una superficie da dati puntuali: abbiamo bisogno di ulteriori ipotesi su come le caratteristiche statistiche del processo spaziale variano da una posizione all'altra e da una realizzazione all'altra (anche se , in pratica, di solito sarà disponibile solo una realizzazione). Ma questa esposizione dovrebbe essere sufficiente per seguire come la ricerca di un "migliore" predittore lineare non distorto ("BLUP") porti direttamente a un sistema di equazioni lineari.
A proposito, il kriging come di solito praticato non è esattamente uguale alla stima dei minimi quadrati, perché è stimato in una procedura preliminare (nota come "variografia") usando gli stessi dati. Ciò è in contrasto con le ipotesi di questa derivazione, che presumeva che fosse noto (e a maggior ragione indipendente dai dati). Quindi, all'inizio, Kriging ha alcuni difetti concettuali e statistici incorporati in esso. I professionisti premurosi lo hanno sempre saputo e hanno trovato vari modi creativi per (tentare di) giustificare le incoerenze. (Avere molti dati può davvero aiutare.) Esistono ora delle procedure per la stima simultanea diΣ ΣΣΣΣe prevedere una raccolta di valori in posizioni sconosciute. Richiedono ipotesi leggermente più forti (normalità multivariata) per realizzare questa impresa.