Ho una serie di dati mensili sulla temperatura della superficie del mare (SST) e voglio applicare una metodologia di cluster per rilevare regioni con modelli SST simili. Ho una serie di file di dati mensili che vanno dal 1985 al 2009 e voglio applicare il clustering ogni mese come primo passo.
Ogni file contiene dati grigliati per 358416 punti in cui circa il 50% sono terreni e sono contrassegnati con un valore di 99,99 che sarà NA. Il formato dei dati è:
lon lat sst
-10.042 44.979 12.38
-9.998 44.979 12.69
-9.954 44.979 12.90
-9.910 44.979 12.90
-9.866 44.979 12.54
-9.822 44.979 12.37
-9.778 44.979 12.37
-9.734 44.979 12.51
-9.690 44.979 12.39
-9.646 44.979 12.36
Ho provato il metodo di clustering CLARA e ho ottenuto alcuni risultati apparentemente piacevoli, ma mi sembra anche che stia semplicemente uniformando (raggruppando) gli isoline. Quindi non sono sicuro che questo sia il miglior metodo di clustering per analizzare i dati spaziali.
Esiste un altro metodo di clustering dedicato a questo tipo di set di dati? Qualche riferimento sarebbe utile per iniziare a leggere.
Grazie in anticipo.