Strumenti di statistica spaziale: analisi di clustering su dati raster

Ho un problema apparentemente semplice, ma non riesco a trovare una metodologia chiara da usare.

Ho il compito di delimitare "aree urbane" da poligoni convessi vettoriali, usando il set di dati Popolazione del mondo a griglia di CIESIN

Questo set di dati fornisce valori di densità di popolazione in tutto il mondo, come file raster. Il problema è, come hai già intuito, che i valori di densità stanno cambiando molto e la definizione di "urbano" è abbastanza relativa.

Ho cercato di usare un approccio classico e ho calcolato le pendenze come se i valori di densità fossero altitudini, ma i valori delle pendenze erano anche molto disparati e complessi dal punto di vista spaziale, complessi.

Ho esaminato gli algoritmi di clustering spaziale, gli strumenti LISA (Local Indocators of Spatial Association), con ArcGIS e GeoDa, ma sono piuttosto perso tra strumenti molto specifici. Alcuni dei metodi funzionano solo su forme vettoriali, quindi sono necessarie una riclassificazione e una vettorializzazione (calcolo lungo).

Potete aiutarmi a perfezionare l'insieme di metodi e strumenti da usare? Grazie !

— Laurent Jégou
fonte

Qual è esattamente la tua definizione di "urbano"? A proposito, non mi aspetto che tutte le aree urbane siano adeguatamente descritte da poligoni convessi . Molti hanno forme controllate da caratteristiche geografiche - montagne, litorali e fiumi - che sono altamente non convesse.

— whuber

La definizione non è data, non una costante. Penso che l'obiettivo sia trovare aree sostanzialmente più dense nel rispetto del loro ambiente, che varia. Quindi l'idea di statistiche spaziali e LISA. Hai ragione sulla convessità, avrei dovuto scrivere "non autointersecando e non intersecando altri poligoni".

— Laurent Jégou,

Come complemento, ho trovato un intero modulo R dedicato agli strumenti di agglomerazione spaziale: spdep.

— Laurent Jégou,

Risposte:

Ho lavorato un po 'su questo per il mio Master http://ian01.geog.psu.edu/papers/mscthesis.pdf - fondamentalmente ho lavorato su cambiamenti di gradiente ma la discussione può aiutarti in questo.

— Ian Turton
fonte

Grazie, lo leggerò presto, ma è promettente :-)

— Laurent Jégou,

Ho provato il doppio metodo derivato di Sobel 2 che descrivi nella tesi, su una zona di test limitata, ed è molto interessante! Il nocciolo urbano chiaro è isolato, disprezzando valori di densità molto diversi. Mille grazie :) A proposito, ho usato un software gratuito e opensource per calcolare le convoluzioni e la matematica raster: Opticks.

— Laurent Jégou,

Una misura di luce artificiale sarebbe un buon indicatore per le condizioni urbane. Una ricerca su Google dovrebbe trovare esempi di studi.

— b_dev,

@indiehacker - L'ho osservato ma è culturalmente dipendente, ad esempio la Francia è molto più scura del Regno Unito.

— Ian Turton

Dal punto di vista della densità di popolazione, una "area urbana" dovrebbe generalmente soddisfare solo alcuni criteri assiomatici :

Il suo confine non dovrebbe includere alcun punto di (relativamente) alta densità rispetto alla massima densità all'interno.
Dovrebbe essere semplicemente collegato (senza "buchi").
La sua densità media di popolazione dovrebbe superare alcune soglie prestabilite.

L'assioma (1) è il più naturale: se un punto limite avesse un'alta densità, sposteremmo il confine verso l'esterno per includerlo all'interno dell'area urbana. Vorrei suggerire che "relativo" significa come proporzione del massimo , come un decimo o un centesimo o altro. Axiom (2) evita di escludere parchi e altre regioni a bassa densità che si verificano naturalmente nelle città. Axiom (3) , che poiché dipende da una soglia è in qualche modo arbitrario, elimina i piccoli villaggi compatti.

In realtà, esiste almeno un altro elemento di arbitrarietà: qualsiasi mappa con griglia della densità di popolazione media implicitamente la media delle popolazioni sui quartieri locali (pari a una cella in alcuni casi e uguale a un raggio del kernel per le stime della densità del kernel). Accettiamo questa dimensione di vicinato implicita (che può essere modificata eseguendo i primi mezzi focali o altri smooths del kernel sulla mappa della densità originale), questa soglia di popolazione e il senso di "relativamente alto" nell'assioma 1 come parametri impostabili dall'utente che controllano il risultato.

Questi assiomi portano naturalmente ad un algoritmo abbastanza semplice : bisogna localizzare i massimi locali, guardare nei loro quartieri fino a quando non viene trovato un confine per soddisfare l'assioma (1), riempire tutti i buchi per soddisfare l'assioma (2), quindi schermare tutte queste aree candidate secondo (3). Questo viene fatto come segue:

Facoltativamente, leviga la mappa della densità.
Esegui un algoritmo di "riempimento" su una mappa relativa alla densità (vedi sotto).
RegionRaggruppa il risultato.
Rimuovi i buchi dai poligoni RegionGrouped.
Esegui somme zonali della densità di popolazione sui poligoni pieni.
Elimina eventuali poligoni con somme (o densità medie) al di sotto della soglia della popolazione (densità).

Ciò che rimane è la tua soluzione.

Lasciatemi dire un po 'di più sul passaggio (1), che è la chiave. Un algoritmo di riempimento identifica i "pozzi" e li "riempie" fino a un valore costante al di sopra delle loro quote. Questo è esattamente ciò che Axiom (1) ci chiede di fare, a condizione che (a) possiamo fare in modo che "sink" giochi il ruolo di "massimo locale" e (b) fare in modo che "quantità costante al di sopra" giochi il ruolo di " frazione costante di. " Il modo per farlo è riempiendo il logaritmo negativo della densitàpiuttosto che la densità stessa. (Aggiungi una minuscola costante prima alla densità - diciamo, circa 0,1 persone per chilometro quadrato - prima di prendere il tronco, in modo che eventuali celle contenenti zeri non causino problemi.) I "laghi" nella densità del tronco negativa identificano il candidato aree urbane. Hai ancora tre parametri indipendenti con cui giocare (entrando nei passaggi 0, 1 e 5); impostarli richiederà qualche riflessione su ciò che realmente intendi per "area urbana", nonché una sperimentazione.

— whuber
fonte

Grazie per la tua risposta dettagliata. Proverò a trovare gli strumenti software giusti (o programmarli) per testare l'algoritmo di riempimento con il registro negativo, che sembra un buon vantaggio.

— Laurent Jégou,