Modellare una tendenza spaziale mediante regressione con le coordinate come predittori


9

Ho intenzione di includere le coordinate come covariate nell'equazione di regressione al fine di adattarmi all'andamento spaziale che esiste nei dati. Successivamente, voglio testare i residui sull'autocorrelazione spaziale in variazioni casuali. Ho diverse domande:

  1. Dovrei eseguire una regressione lineare in cui solo le variabili indipendenti sono coordinate e e quindi testare i residui sull'autocorrelazione spaziale, o dovrei piuttosto includere non solo le coordinate come covariate ma anche altre variabili e quindi testare i residui.xy

  2. Se mi aspetto di avere una tendenza quadratica, quindi includo non solo , ma anche, , e , ma alcuni di essi ( e ) hanno il valore più alto del soglia - dovrei escludere quelle variabili con valore più alto come non significative? Come dovrei quindi interpretare la tendenza, non è certamente più quadratica?x,yxyx2y2xyy2pp

  3. Credo che dovrebbe trattare ed coordinate eventuali altre covariate, e li test avente relazione lineare con variabile dipendente costruendo grafici dei residui parziali ... ma poi una volta li trasformare (se mostrano hanno bisogno trasformazione), che non sarà essere quel tipo di tendenza più (specialmente se includo , e per tendenza quadratica). Potrebbe mostrare che , per esempio, ha bisogno di essere trasformato, mentre non lo fa? Come dovrei reagire in queste situazioni?xyxyx2y2x2x

Grazie.

Risposte:


3

Penso che potresti stare meglio adattando un modello lineare di effetti misti con effetti casuali spazialmente correlati (a volte chiamato un modello geostatistico ). Supponendo che i tuoi dati siano gaussiani, devi specificare un modello del modulo:

Yi=μi+Si+ϵi,

per osservazioni , con rappresentano errori iid e che rappresentano i termini spaziali (dove ). La media potrebbe essere una funzione di altre covariate (ovvero ecc.) Oppure potrebbe essere solo una costante (potrebbe essere meglio iniziare con quest'ultimo per semplicità).n1inϵN(0,τ2)SMVN(0,σ2R)S={S1,...,Sn}μiμi=β0+β1xi1+β2xi2

La matrice di correlazione per i termini spaziali (che determina la correlazione che pensi che dovrebbe essere ogni osservazione) può essere specificata osservando il variogramma empirico. Generalmente la correlazione tra le osservazioni è scelta per dipendere solo dalla distanza tra loro (è qui che le tue coordinate entrano nel modello).R

Il capitolo 2 della geostatistica basata sui modelli di Diggle e Ribeiro (2000) dovrebbe fornire un'introduzione più dettagliata. Il pacchetto R geoR ha molte procedure per adattare i modelli geostatistici, quindi potresti trovarlo utile (vedi http://cran.r-project.org/web/packages/geoR/geoR.pdf ).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.