Calcolo della correlazione spaziale tra le caratteristiche da due livelli separati in QGIS


10

Sto cercando di determinare se la presenza di un gran numero di truppe militari in servizio attivo in un'area è spazialmente correlata con livelli più alti / più bassi di criminalità violenta. Cioè, le aree circostanti le grandi basi militari sono più / meno violente, in media, delle aree che non sono vicine alle basi militari?

Sto lavorando con i seguenti due set di dati:

(1) una serie di dati puntuali di basi militari negli Stati Uniti continentali e dei corrispondenti livelli di truppe:

Posizioni delle installazioni militari statunitensi nella parte inferiore 48

(2) una serie di dati a livello nazionale sui tassi di criminalità violenta per città:

Livelli di criminalità violenta negli Stati Uniti per città

Mi sento come se stessi cercando una sorta di modello basato sulla gravità in cui la funzione "massa" fornisce livelli di truppe su ogni base. Quindi una grande presenza di truppe eserciterebbe influenza su un'area più ampia e avrebbe un effetto più forte vicino al centro di massa (cioè la posizione del punto nello strato GIS).

Sto pensando che, concettualmente, sarebbe simile a questo: modello a gravità - diagramma di decadimento della distanza

In questo diagramma X, Y, Z rappresentano basi militari. a, b, c, d rappresentano ciascuna le città (ognuna delle quali ha un campo del tasso di violenza nella sua tabella degli attributi).

Il gradiente attorno alle basi rappresenta il campo di influenza, che diminuisce esponenzialmente con la distanza dal centroide di base. Una presenza maggiore di truppe equivale a un raggio di influenza maggiore (con una certa soglia massima) e anche a un'influenza più forte vicino al centro rispetto alle aree vicine a una base più piccola.

Ad ogni città verrà assegnato un punteggio basato sulla somma della grandezza di tutti i vettori della "forza" da tutte le basi circostanti il ​​cui raggio di influenza si trovano in. Quindi, per esempio, nel mio diagramma, Città a avrebbe un punteggio di 0 poiché giace al di fuori del raggio di qualsiasi base. Città B verrebbe influenzata solo da base di X . Città c sarebbe influenzata solo da base Z , e il suo punteggio sarebbe inferiore a quello B , dal momento che X è una base molto più grande di Z . Infine, la città d si trova nel raggio di entrambe le basi X e Y, riceverebbe un punteggio basato sulla somma dell'entità dell'influenza da entrambe le basi. Vorrei quindi vedere se esiste una correlazione tra punteggio più alto per una città e tassi più elevati di violenza.

Ho esaminato vari modelli basati sulla gravità (modelli Huff , ecc.) Ma non sono riuscito a trovare molto su QGIS / Python e non sono sicuro di come implementare ciò che ho descritto sopra ... Qualcuno ha suggerimenti per questo? Qualcuno di voi ha già fatto questo tipo di analisi in altre aree prima?

Quindi il TLDR è:

  • Quali tecniche statistiche potrei usare per questo tipo di domanda?
  • Esistono strumenti integrati in QGIS (o disponibili come plug-in) in grado di farlo?
  • Se non c'è nulla di simile in QGIS, ci sono librerie Python che possono eseguire questo tipo di analisi?

Giusto per essere chiari, sono consapevole che ci sono molti altri fattori che entrano in gioco con i tassi di violenza (povertà, densità urbana, ecc.) Ma per semplicità supponiamo che non esistessero variabili di confondimento significative e che ero solo guardando la correlazione tra queste due variabili (livelli di truppe e tassi di violenza). A questo punto, questo è solo un esercizio di apprendimento e sto cercando di capire quali strumenti sono disponibili per me. Grazie!
J. Taylor,

1
Per rispondere alla tua terza domanda, ho trovato PySAl, che è stato sviluppato dal Prof Luc Anselin che vale la pena guardare in alto, visti i tuoi interessi. Ha anche lavorato su GeoDa, che è una soluzione pronta all'uso per quello che stai guardando. Potrebbe esserci un plugin PySAl per QGIS? pysal.readthedocs.org/en/latest
raphael

Risposte:


2

Espandendo il mio commento sopra

Quello che probabilmente finirai per voler fare è eseguire una regressione lineare con ritardo spaziale, che spiega la correlazione spaziale di alcune delle tue variabili (dovrò guardare i miei appunti su questo).

Luc Anselin è stato un pioniere in questo campo e dovresti dare un'occhiata al suo lavoro, in particolare agli strumenti (gratuiti) e alla documentazione del Centro GeoDa . Entrambi questi strumenti potrebbero interessarti:

  1. GeoDa, un software autonomo per esplorare la correlazione spaziale (automatica).
  2. PySAL , una libreria di analisi spaziale Python.

La mia ricerca di un plugin PySAL per QGIS ha trovato qualcosa che non è stato aggiornato da anni, ma potresti avere più fortuna.


Grazie Raffaello. Esaminerò meglio il concetto di "regressione lineare con ritardo spaziale". Mi ero già imbattuto in PySAL / GeoDa grazie a una raccomandazione sul canale IRC #qgis. Hai ragione a dire che molta della documentazione sulla pagina GeoDa è stata utile. Non ho ancora trovato nulla che faccia esattamente quello che voglio, ma se finisco per codificarlo da solo, ci sono molti strumenti che sembrano essere utili "blocchi".
J. Taylor,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.