Risposte:
Nessuno degli strumenti predefiniti in ArcGIS (o in qualsiasi altro GIS, AFAIK) farà il lavoro correttamente.
In un problema come questo è necessario quantificare ciò che si intende per "raggruppamento" e quindi è necessario posizionare un modello di probabilità per valutare se il grado misurato di raggruppamento avrebbe potuto essere prodotto da possibilità accidentali.
Come esempio di come procedere, è possibile scegliere di misurare il raggruppamento in termini di distanze tipiche tra edifici di tipo xe l' edificio più vicino di tipo y . Questo è un semplice calcolo: rappresenta semplicemente entrambi gli insiemi di edifici con strati di punti separati ed esegui un'unione spaziale tra le Y e le X. La tabella degli attributi, che ha ancora un record per ogni edificio di tipo x , ora includerà la distanza dalla y più vicina . È possibile utilizzare la distanza media come misura.
Testare se questo potrebbe essere il risultato del caso è più complicato. Una plausibile interpretazione di questa impostazione è che la presenza precedente di edifici di tipo y ha incoraggiato lo sviluppo di edifici di tipo x relativamente vicini a quelli di y . Altrimenti, potremmo ipotizzare che gli edifici di tipo x avrebbero potuto essere costruiti ovunque apparissero anche altri edifici. Questo porta al seguente semplice test di permutazione . Crea uno strato di punti di tutte le possibili posizioni in cui potrebbero apparire edifici di tipo x . Questo strato potrebbe essere la posizione di tutti gli edifici nell'area eretta durante lo stesso periodo della xgli edifici erano (compresi gli x edifici stessi, ovviamente). Unisci spazialmente il livello y per ottenere le distanze dall'edificio di tipo y più vicino . Il resto del calcolo funziona al di fuori della tabella degli attributi: i calcoli geografici vengono eseguiti. Quello che farai è usare ripetutamente un generatore di numeri casuali per prendere un semplice campione casuale di tutti questi edifici, ogni campione con esattamente tanti elementi quanti ne hai di tipo x edifici. Calcola la distanza media per questo campione. Ripeti fino a quando non hai molte statistiche sulla distanza media. Se quasi tutte queste distanze medie ottenute casualmente sono superiori alla distanza media misurata per la xtipo di edifici, puoi concludere che le x non sono raggruppate per caso: l'effetto è reale.
(Tali calcoli sono meglio programmati su una piattaforma adatta a tali scopi, come ad esempio "R", ma quasi tutti i software di elaborazione possono essere messi in servizio, anche Excel. La programmazione è molto, richiede poco più che sapere come scrivere loop e selezionare elementi da matrici a caso.)
Questo approccio al test di permutazione è superiore alle soluzioni pre-programmate perché spiega esplicitamente i modelli di sviluppo degli edifici in quest'area. Se non si esegue questa operazione, spesso si trova "significativo" prova di clustering, ma non si può concludere qualcosa di utile da esso, perché il raggruppamento potrebbe essere stato causato da altri fattori come ad esempio i modelli di strade, le posizioni di siti adatti allo sviluppo e molte altre cose.
Naturalmente, il metodo di analisi dei dati dovrebbe dipendere dal problema sostanziale che motiva l'analisi.
Ma ecco alcune idee:
Come funziona l'analisi del cluster spaziale a distanza multipla: la funzione k (Ripatial Statistics) di Ripley , dove io e j nell'equazione indicherebbe i tuoi edifici xey. La funzione K di Ripley fornirà inferenza probabilistica.
Esistono algoritmi complessi per la rilevazione di modelli di co-locazione che puoi usare su Google.
Non ho mai fatto analisi di cluster in GIS da solo, ma sarebbe più semplice creare punti / poligoni per rappresentare un determinato cluster di X e / o Y. Ad esempio, se si creassero punti per indicare l'edificio Y, si potrebbe quindi utilizzare lo strumento Distanza punto per ottenere tutti i punti dell'edificio X a una determinata distanza dalle posizioni di origine.
Altrimenti, la creazione di un buffer attorno agli edifici di tipo Y e la selezione di tutti gli edifici di tipo X otterrà lo stesso risultato se non si dispone di ArcInfo.
È possibile combinare entrambi i livelli aggiungendo una colonna binaria (0,1) per identificare se l'edificio proviene da X o Y.
Da lì usando GeoDa è possibile identificare l'auto-correlazione spaziale locale (clustering) e determinare se era high-low (uno strato raggruppato attorno all'altro livello) low-high (l'inverso) o high-high o low-low (self- il clustering). Guida dell'utente qui (.pdf)