autocorrelazione spaziale per i dati di serie storiche


11

Ho un set di dati di 20 anni di un conteggio annuale di abbondanza di specie per un set di poligoni (~ 200 poligoni continui di forma irregolare). Ho usato l'analisi di regressione per dedurre le tendenze (variazione nel conteggio annuale) per ciascun poligono, nonché aggregazioni di dati poligonali basati sui limiti di gestione.

Sono sicuro che ci sia autocorrelazione spaziale nei dati, che sicuramente influenzerà l'analisi di regressione per i dati aggregati. La mia domanda è: come posso eseguire un test SAC per i dati delle serie temporali? Devo guardare il SAC dei residui dalla mia regressione per ogni anno (I di Moran globale)? O posso eseguire un test con tutti gli anni?

Una volta che ho provato che sì, c'è SAC, c'è un modo semplice per affrontarlo? Il mio background di statistiche è minimo e tutto ciò che ho letto sulla modellazione spazio-temporale sembra molto complesso. So che R ha una funzione di autocovariata ponderata in base alla distanza - è assolutamente semplice da usare?

Sono davvero piuttosto confuso su come valutare / aggiungere SAC per questo problema e apprezzerei molto qualsiasi suggerimento, collegamento o riferimento. Grazie in anticipo!


1
Desideri modellare i processi spaziali sottostanti o modificare la stima della matrice di varianza-covarianza per tenere conto dell'autocorrelazione spaziale?
generic_user

1
O vuoi fare entrambe le cose ...
gregmacfarlane,

Grazie per le tue risposte! Penso che i miei dati abbiano autodipendenza spaziale - è biologico e molto probabilmente il conteggio delle specie nelle unità vicine avrà un impatto sulle unità circostanti. Le mie unità sono abbastanza grandi, quindi intendo utilizzare l'opzione "Collegamento su bordi e angoli" per impostare il ritardo di distanza per testare SAC. Le funzioni R per i modelli SAC sembrano fattibili (ancora sopra la mia testa!). Grazie ancora.
Rozza,

Benvenuti nel sito Rozza, questo dovrebbe essere lasciato come commento a una delle risposte. Assicurati di valutare le risposte esistenti se hanno fornito risposte utili e contrassegnane una come risposta alla tua domanda se ritieni che sia stata affrontata in modo soddisfacente.
Andy W,

Risposte:


5

Secondo questo documento , OLS è coerente in presenza di autocorrelazione spaziale, ma gli errori standard sono errati e devono essere adeguati. Solomon Hsiang fornisce codice stata e matlab per farlo. Sfortunatamente non ho familiarità con nessun codice R per questo.

Esistono certamente altri approcci a questo tipo di problema nelle statistiche spaziali che modellano esplicitamente i processi spaziali. Questo gonfia solo gli errori standard.

Purtroppo gli econometrici teorici sembrano trarre piacere dall'offuscamento. Il documento collegato è davvero difficile da leggere. Fondamentalmente quello che dice è eseguire qualunque regressione tu voglia, e poi andare a correggere gli errori standard in seguito, cioè: usando il codice di Hsiang. Lo spazio non vi entra finché non provate a stimare la varianza del vostro stimatore. Intuitivamente, se tutte le differenze sono ravvicinate, sei meno sicuro che la tua stima non sia solo una reliquia di uno shock spaziale non osservato.

Nota che devi specificare una larghezza di banda del kernel su cui pensi che il processo spaziale potrebbe funzionare.

Questa risposta è fondamentalmente una rehash copia / incolla di una risposta simile che ho fatto qui


5

Se il problema è errori correlati automaticamente, , allora OLS è coerente ma inefficiente, come dice ACD. È come una correlazione seriale nell'econometria delle serie storiche.y=Xβ+u,u=ρWu+ϵ

Ma se c'è autodipendenza spaziale (anche chiamata autocorrelazione, in modo confuso), , allora OLS è incoerente. È la stessa cosa della distorsione da variabile mancante. Se hai entrambi i problemi, devi utilizzare il modello di Durbin spaziale, .y = ρ W y + X β + W X λ + ϵy=ρWy+Xβ+ϵy=ρWy+Xβ+WXλ+ϵ

Il pacchetto spdep per R contiene numerose funzioni che calcolano le matrici dei pesi spaziali, stimano le regressioni spaziali e fanno altre cose. Ho una buona esperienza con le lagsarlmfunzioni, ma vedo nella documentazione del pacchetto che esiste una sacsarlmfunzione che sembra essere più di ciò che stai cercando.

Per quanto riguarda l'aspetto temporale del tuo problema, le ipotesi che fai sulla dipendenza faranno molto per determinare le specifiche del tuo modello. Le tue aree interagiscono direttamente tra loro? Ne sono esempi i mercati commerciali o delle abitazioni; le esportazioni da un paese dipendono fortemente dalle importazioni in un altro e il prezzo di vendita delle case acquistate di recente è un contributo molto importante al prezzo di vendita delle case vicine. In questo caso, ha senso specificare la matrice di pesi per soddisfare questa dipendenza. Consenti a una casa acquistata nel tempo di essere "vicini" con case nel tempo , ma non con case nel tempo .t t - 1 t + 1Wtt1t+1

Se i termini sono correlati ma non logicamente dipendenti l'uno dall'altro, come i rendimenti agricoli, probabilmente avrebbe più senso avere una sola matrice insensibile al tempo , ma includere i manichini degli anni nella specificaXWX


1
Buon post. Penso che la distinzione che il PO dovrebbe tenere presente quando si sceglie tra i due approcci è se il "risultato" in un poligono influenzerà il risultato dei suoi vicini. Se è così, segui l'approccio di gmacfarlane. In caso contrario, quello che propongo è più semplice.
generic_user
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.