Principali vantaggi dei modelli di processo gaussiani


11

Il processo gaussiano è stato ampiamente utilizzato, specialmente nell'emulazione. È noto che la domanda computazionale è elevata ( ).0(n3)

  1. Cosa li rende popolari?
  2. Quali sono i loro vantaggi principali e nascosti?
  3. Perché vengono utilizzati al posto dei modelli parametrici (per modello parametrico intendo la regressione lineare tipica in cui è possibile utilizzare diverse forme parametriche per descrivere l'andamento input vs output; ad esempio, qaudratic)?

Gradirei davvero una risposta tecnica che spieghi le proprietà intrinseche che rendono unico e vantaggioso il processo gaussiano


Puoi chiarire cosa intendi con modelli parametrici?
Alexey Zaytsev,

@Alexey Ho chiarito cosa intendo per modello paramtrico sopra. Grazie
Wis,

Da quello che presumo sui modelli parametrici è necessario specificare il modello a mano per ogni problema. Questo non è sempre possibile, poiché la vera natura non è sempre conosciuta. Inoltre, possono esserci difficoltà nell'adattamento di questi modelli, mentre per i processi gaussiani la stima dei parametri funziona bene quasi ogni volta.
Alexey Zaytsev,

4
Le spline e la regressione lineare sono equivalenti alla regressione dei processi gaussiani con la funzione di covarianza corretta selezionata. Ma i processi gaussiani forniscono un comodo quadro probabilistico adatto a molti compiti.
Alexey Zaytsev,

1
Quando non useresti il ​​processo gaussiano?
Alby,

Risposte:


6

I principali vantaggi sono dal punto di vista ingegneristico (come menzionato da @Alexey). Nella procedura di Kriging ampiamente utilizzata è possibile interpretare il proprio "spazio" fornendo un modello di "correlazione" (o covarianza) (in genere chiamato ellissoide variogramma ) per le relazioni che dipendono dalla distanza e dall'orientamento.

Non c'è nulla che impedisca ad altre metodologie di avere le stesse caratteristiche, è appena successo che il modo in cui il kriging è stato inizialmente concettualizzato ha avuto un approccio amichevole verso le persone che non erano statistici.

Oggi con l'ascesa di metodologie stocastiche basate sulla geostatistica, tra cui la simulazione gaussiana sequenziale, tra le altre , queste procedure vengono utilizzate in settori in cui è importante definire lo spazio di incertezza (che può richiedere da migliaia a milioni di dimensioni). Ancora una volta, dal punto di vista ingegneristico, gli algoritmi basati sulla geostatistica sono molto facili da includere nella programmazione genetica . Pertanto, quando si verificano problemi inversi, è necessario poter testare più scenari e verificarne l'adattabilità alla funzione di ottimizzazione.

Lasciamo per un momento l'argomentazione pura uno stato i fatti per un moderno esempio reale di questo uso. È possibile campionare direttamente campioni sotterranei (dati concreti) o creare una mappa sismica del sottosuolo (dati morbidi).

Nei dati concreti puoi misurare una proprietà (diciamo impedenza acustica) direttamente senza errore (ish). Il problema è che questo è scarso (e costoso). D'altra parte hai la mappatura sismica che è letteralmente una mappa del sottosuolo, in termini di pixel, ma che non ti dà impedenza acustica. Per motivi di semplicità diciamo che ti dà il rapporto tra due valori di impedenza acustica (in alto e in basso). Quindi un rapporto di 0,5 potrebbe essere una divisione di 1000/2000 o 10 000/20 000. È uno spazio di soluzioni multiple e diverse combinazioni lo faranno, ma solo una rappresenta accuratamente la realtà. Come si risolve questo?

Il modo in cui funziona l' inversione sismica (le procedure stocastiche) è producendo scenari plausibili (e questa è un'altra storia tutti insieme) di impedenza acustica (o altre proprietà), trasforma quegli scenari in un sismico sintetico (come il rapporto nell'esempio precedente) e confrontare il sismico sintetico con quello reale (correlazione). Gli scenari migliori verranno utilizzati per produrre ancora più scenari, convergendo in una soluzione (non è così facile come sembra).

Tenendo conto di ciò e parlando dal punto di vista dell'usabilità, risponderei alle tue domande nel modo seguente:

1) Ciò che li rende popolari è l' usabilità, la flessibilità nell'attuazione, un buon numero di centri di ricerca e istituzioni che continuano a creare procedure gaussiane nuove e più adattabili per diversi campi (in particolare nelle geoscienze, GIS incluso).

2) I vantaggi principali sono , come detto prima, l'usabilità e la flessibilità dal mio punto di vista. Se è facile da manipolare e facile da usare, basta farlo. Non ci sono caratteristiche particolari nei processi gaussiani che non sono riproducibili in altre metodologie (statistiche o altro).

3) Vengono utilizzati quando è necessario includere più informazioni nel proprio modello rispetto ai soli dati (informazioni che hanno relazioni spaziali, distribuzioni statistiche e così via ...). Posso assicurarti che se hai molti dati con un comportamento isotropico usando kriging è una perdita di tempo. Puoi ottenere gli stessi risultati utilizzando qualsiasi altro metodo che richiede meno informazioni, è più veloce da eseguire.


E quando un altro modello è una scelta migliore?
Ben

1
@Ben Dipenderà sempre dal case study. I metodi basati su Kriging o Kriging hanno un costo di calcolo elevato (quindi non veloce). Ad esempio, i moderni televisori 4k (o più) utilizzano metodi di interpolazione per cercare di migliorare il contenuto creato per risoluzioni più piccole. Ciò implica che deve eseguire questa operazione velocemente e senza l'intervento dell'utente (che richiederebbe un modello di covarianza). Se dovessi risolvere questo particolare problema, eviterei del tutto Kriging. Inoltre alcuni fenomeni sono basati sul modello, o hanno una variabile discreta, o possono essere ridotti alla formula (FEM, per esempio), ecc ...
armatita

E quando la velocità non è importante?
Ben

@Ben Speed ​​è meno importante se il tuo risultato non deve essere immediato. La modellazione del sottosuolo, la previsione meteorologica e un mucchio di operazioni all'interno delle scienze del GIS sono solo alcuni esempi. Un altro è quello presentato nella risposta (inversione sismica).
armatita,

Scusa, non l'ho capito. Né la computazionale né la velocità dei risultati sono importanti, quali sono gli svantaggi di un GP? O in altre parole: non dovrebbe essere usato molto più spesso?
Ben

7

Per gli ingegneri è importante:

  • avere intervalli di confidenza per le previsioni
  • per interpolare i dati di allenamento
  • avere modelli lisci e non lineari
  • utilizzare i modelli di regressione ottenuti per la progettazione adattiva di esperimenti e ottimizzazione

I processi gaussiani soddisfano tutti questi requisiti.

Inoltre, spesso i set di dati di ingegneria e geostatistica non sono così grandi o hanno una struttura di griglia specifica che consente un'inferenza rapida.


1
Grazie per il tuo commento . Sembra che a causa della loro interpretazione bayesiana i modelli di processo gaussiani possano avere una buona quantificazione dell'incertezza, tuttavia ciò è possibile anche nella regressione parametrica. Sto cercando un approccio tecnico in grado di spiegare l'insieme dei vantaggi statistici
Wis,

3

I vantaggi del modello gaussiano.

Il PDF gaussiano dipende solo dai momenti del 1 ° e del 2 ° ordine. Un processo gaussiano stazionario di ampio senso è anche un processo stazionario di senso stretto e viceversa.

I PDF gaussiani possono modellare la distribuzione di molti processi, tra cui alcune importanti classi di segnali e rumore. La somma di molti processi casuali indipendenti ha una distribuzione gaussiana (teorema del limite centrale).

I processi non gaussiani possono essere approssimati da una combinazione ponderata (cioè una miscela) di un numero di pdf gaussiani di mezzi e varianze appropriati.

Metodi di stima ottimali basati su modelli gaussiani spesso portano a soluzioni lineari e matematicamente tracciabili.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.