questa domanda è iniziata come " Clustering dei dati spaziali in R " e ora è passata alla domanda DBSCAN.
Come suggerito dalle risposte alla prima domanda, ho cercato informazioni su DBSCAN e ho letto alcuni documenti su. Sono sorte nuove domande.
DBSCAN richiede alcuni parametri, uno dei quali è "distanza". Dato che i miei dati sono tridimensionali, longitudine, latitudine e temperatura, quale "distanza" dovrei usare? quale dimensione è correlata a quella distanza? Suppongo che dovrebbe essere la temperatura. Come trovo tale distanza minima con R?
Un altro parametro è il numero minimo di punti necessari per formare un cluster. Esiste un metodo per trovare quel numero? Purtroppo non ho trovato.
Cercando su Google non sono riuscito a trovare un esempio R per l'utilizzo di dbscan in un set di dati simile al mio, conosci qualche sito Web con questo tipo di esempi? Quindi posso leggere e provare ad adattarmi al mio caso.
L'ultima domanda è che il mio primo tentativo di R con DBSCAN (senza una risposta adeguata alle domande precedenti) ha provocato un problema di memoria. R dice che non può allocare il vettore. Comincio con una griglia distanziata di 4 km con 779191 punti che termina in circa 300000 file x 3 colonne (latitudine, longitudine e temperatura) quando si rimuovono punti SST non validi. Qualsiasi suggerimento per risolvere questo problema di memoria. Dipende dal mio computer o dallo stesso DBSCAN?
Grazie per la pazienza di leggere un messaggio lungo e probabilmente noioso e per il vostro aiuto.