Quello che hai è una sequenza di eventi in base al tempo, quindi non esitare a chiamarlo Serie storiche!
Il raggruppamento in serie temporali ha 2 significati diversi:
- Segmentazione di serie storiche, ad esempio si desidera segmentare una singola serie temporale in intervalli di tempo diversi in base a somiglianze interne.
- Raggruppamento di serie temporali, ad esempio se si dispone di più serie temporali e si desidera trovare cluster diversi in base alle somiglianze tra loro.
Presumo tu intenda il secondo ed ecco il mio suggerimento:
Hai molti veicoli e molte osservazioni per veicolo, cioè hai molti veicoli. Quindi hai diverse matrici (ogni veicolo è una matrice) e ogni matrice contiene N righe (n. Di osservazioni) e colonne T (punti temporali). Un suggerimento potrebbe essere l'applicazione del PCA a ciascuna matrice per ridurre la dimensibilità e l'osservazione dei dati nello spazio del PC e vedere se vi sono relazioni significative tra diverse osservazioni all'interno di una matrice (veicolo) . Quindi puoi mettere ciascuna osservazione per tutti i veicoli l'uno sull'altro e creare una matrice e applicare PCA a quello per vedere le relazioni di una singola osservazione tra veicoli diversi.
Se non si hanno valori negativi, si consiglia vivamente la fattorizzazione a matrice per la riduzione dimensionale dei dati del modulo a matrice.
Un altro suggerimento potrebbe essere quello di mettere le matrici una sopra l'altra e costruire un tensore N x M x T dove N è il numero di veicoli, M è il numero di osservazioni e T è la sequenza temporale e applicare la Decomposizione tensore per vedere le relazioni a livello globale.
In questo documento viene mostrato un approccio molto utile al clustering di serie storiche in cui l'implementazione è semplice e immediata.
Spero che abbia aiutato!
In bocca al lupo :)
MODIFICARE
Come hai detto, intendi la segmentazione delle serie storiche, aggiungo questo alla risposta.
La segmentazione delle serie storiche è l'unico problema di clustering che ha una verità fondamentale per la valutazione. Infatti si considera la distribuzione di generazione dietro le serie storiche e analizzarli Consiglio vivamente questo , questo , questo , questo , questo e questo , dove il problema è ampiamente studiato. Specialmente l'ultimo e la tesi di dottorato.
In bocca al lupo!