Ho un set di dati di eventi accaduti durante lo stesso periodo di tempo. Ogni evento ha un tipo (ci sono pochi tipi diversi, meno di dieci) e una posizione, rappresentata come un punto 2D.
Vorrei verificare l'esistenza di una correlazione tra i tipi di eventi o tra il tipo e la posizione. Ad esempio, forse gli eventi di tipo A di solito non si verificano dove si verificano eventi di tipo B. O forse in alcune aree, ci sono principalmente eventi di tipo C.
Che tipo di strumenti potrei usare per eseguire questo? Essendo un novizio nell'analisi statistica, la mia prima idea è stata quella di utilizzare una sorta di PCA (Principal Component Analysis) su questo set di dati per vedere se ogni tipo di evento aveva il suo componente o forse alcuni lo condividevano (cioè erano correlati)?
Devo dire che il mio set di dati è dell'ordine di 500'000 punti , rendendo le cose un po 'più difficili da gestire.
MODIFICA: Come notato nelle risposte seguenti e nei commenti, la strada da percorrere è modellare questo come un processo a punti marcati, quindi utilizzare R per eseguire tutto il lavoro pesante, come spiegato in dettaglio in questo rapporto del seminario: http: / /www.csiro.edu.au/resources/Spatial-Point-Patterns-in-R.html