Qual è una statistica appropriata per misurare l'autocorrelazione spaziale di punti con valori binari?


9

Sto cercando di determinare il livello di autocorrelazione spaziale in un set di dati puntuale. L'attributo che mi interessa è binario (presenza / assenza di una specie), per cui l'Io di Moran non è appropriato. D'altro canto, le statistiche del conteggio congiunto, che in genere sono consigliate per dati binari o categorici, apparentemente non sono appropriate per i dati puntuali. In breve, la domanda è quindi: qual è una statistica appropriata per misurare l'autocorrelazione spaziale globale e / o locale dei punti quando l'attributo di interesse è binario?

Risposte:


4

La tua affermazione che una statistica di Join-Counts non è appropriata per i dati binari non è corretta. È solo una questione di come viene specificata la matrice dei pesi spaziali (Wij). Come in un Morna-I, non è possibile utilizzare una matrice di distanza in questo tipo di analisi. Tuttavia, è possibile calcolare una matrice binaria appropriata di contingenza utilizzando un limite di distanza. È possibile creare questo tipo di matrice dei pesi spaziali e condurre un'analisi Join-Count nella libreria R spdep. Vedere le funzioni "joincount.test" e joincount.mc (per il test di permutazione di Monte Carlo).


Grazie Jeffrey. I conteggi dei giunti sono chiaramente la strada da percorrere per i dati binari, ma ho visto un suggerimento (non ricordo dove, ora) che i conteggi dei giunti fossero appropriati solo per i dati di area (non punti). Non mi era chiaro perché non fosse possibile creare la matrice dei pesi utilizzando una soglia di distanza e utilizzare un conteggio congiunto, ma non sono riuscito a trovare esempi di questo in alcune ricerche superficiali. C'è un riferimento che puoi fornire per questo tipo di utilizzo?
user13706

Questo è un ampio corpus di pubblicazioni sull'analisi del modello a punti. La statistica Join-Counts non è comunemente usata e, come tale, non è molto diffusa nella letteratura attuale. Ritornerei ai primi lavori di Diggle o Geits. Qual è il tuo obiettivo nel quantificare la dipendenza spaziale nei dati binomiali? Non è possibile utilizzare un coefficiente Join-Counts in qualcosa come effetti misti o modello CAR / SAR. Ecco alcuni retroscena interessanti sul ridimensionamento del modello di occupazione ( en.wikipedia.org/wiki/Scaling_pattern_of_occupancy )
Jeffrey Evans,

1
RandomForest è un modello non parametrico e, come tale, non viene effettuato mediante autocorrelazione. La preoccupazione con questo modello è la correlazione all'interno dell'ensemble bootstrap. Spesso l'autocorrelazione può creare "ridondanza" nei dati che crea distorsioni nel Bootstrap. Vorrei guardare in base alla distribuzione o alle condizioni condizionate delle vostre covariate. Ho il codice R disponibile "R - Traccia densità di probabilità per fattore di raggruppamento" qui: conserveonline.org/workspaces/emt/documents/all.html
Jeffrey Evans,

1
Oh, non vorrei generalizzare RF essendo interamente scatola nera. Questo in realtà non è il caso. Questo modello viene spesso definito come "scatola grigia". Poiché l'autocorrelazione primaria influenza le assunzioni IID nei metodi frequentisti è un'asserzione abbastanza sicura che le assunzioni non parametriche non siano violate.
Jeffrey Evans,

1
Stiamo generalizzando statistiche "non parametriche". Questo comprende molti metodi. Se guardi indietro alle prove di Brieman del 2001, vedrai che la RF non assume indipendenza. Il libro di Hastie "Elements of Statistical Learning" fornisce un solido background statistico per campionare la teoria in relazione ai metodi di apprendimento automatico. Come affermato in precedenza, la preoccupazione è la correlazione nell'ensemble che può certamente essere causata da pseudo-moltiplicazione / autocorrelazione. Tuttavia, questo non è un presupposto modello in RF. Tuttavia, se abbastanza severo, l'effetto netto di bias o overfit è ovviamente lo stesso.
Jeffrey Evans,

0

I dati binari sono un caso d'uso normale per l'autocorrelazione spaziale. Penso che la maggior parte del libro di analisi spaziale ne parlerà. Questo documento potrebbe essere di aiuto.


1
La prima pagina del riferimento sottolinea che "le posizioni dei dati sono aree ", quindi sembra che non si applichi affatto ai dati dei punti.
whuber

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.