Esistono algoritmi di apprendimento senza supervisione per i dati in sequenza temporale?


9

Ogni osservazione nei miei dati è stata raccolta con una differenza di 0,1 secondi. Non lo chiamo una serie temporale perché non ha una data e un timestamp. Negli esempi di algoritmi di clustering (che ho trovato online) e PCA i dati di esempio hanno 1 osservazione per caso e non sono temporizzati. Ma i miei dati hanno centinaia di osservazioni raccolte ogni 0,1 secondi per veicolo e ci sono molti veicoli.

Nota: ho posto questa domanda anche su quora.


1
Si prega di notare la lingua. La tua domanda non è del tutto chiara. Che cosa significa "i dati del campione hanno 1 osservazione per caso e non sono temporizzati"?
Kasra Manshaei,

1
Stavo parlando degli esempi che ho trovato nei tutorial online. I dati di esempio che usano hanno solo 1 osservazione per caso / individuo (ad es. Cliente, paese, ecc.). E quei dati non sono serie temporali.
Umair Durrani,

Risposte:


7

Quello che hai è una sequenza di eventi in base al tempo, quindi non esitare a chiamarlo Serie storiche!

Il raggruppamento in serie temporali ha 2 significati diversi:

  1. Segmentazione di serie storiche, ad esempio si desidera segmentare una singola serie temporale in intervalli di tempo diversi in base a somiglianze interne.
  2. Raggruppamento di serie temporali, ad esempio se si dispone di più serie temporali e si desidera trovare cluster diversi in base alle somiglianze tra loro.

Presumo tu intenda il secondo ed ecco il mio suggerimento:

Hai molti veicoli e molte osservazioni per veicolo, cioè hai molti veicoli. Quindi hai diverse matrici (ogni veicolo è una matrice) e ogni matrice contiene N righe (n. Di osservazioni) e colonne T (punti temporali). Un suggerimento potrebbe essere l'applicazione del PCA a ciascuna matrice per ridurre la dimensibilità e l'osservazione dei dati nello spazio del PC e vedere se vi sono relazioni significative tra diverse osservazioni all'interno di una matrice (veicolo) . Quindi puoi mettere ciascuna osservazione per tutti i veicoli l'uno sull'altro e creare una matrice e applicare PCA a quello per vedere le relazioni di una singola osservazione tra veicoli diversi.

Se non si hanno valori negativi, si consiglia vivamente la fattorizzazione a matrice per la riduzione dimensionale dei dati del modulo a matrice.

Un altro suggerimento potrebbe essere quello di mettere le matrici una sopra l'altra e costruire un tensore N x M x T dove N è il numero di veicoli, M è il numero di osservazioni e T è la sequenza temporale e applicare la Decomposizione tensore per vedere le relazioni a livello globale.

In questo documento viene mostrato un approccio molto utile al clustering di serie storiche in cui l'implementazione è semplice e immediata.

Spero che abbia aiutato!

In bocca al lupo :)


MODIFICARE

Come hai detto, intendi la segmentazione delle serie storiche, aggiungo questo alla risposta.

La segmentazione delle serie storiche è l'unico problema di clustering che ha una verità fondamentale per la valutazione. Infatti si considera la distribuzione di generazione dietro le serie storiche e analizzarli Consiglio vivamente questo , questo , questo , questo , questo e questo , dove il problema è ampiamente studiato. Specialmente l'ultimo e la tesi di dottorato.

In bocca al lupo!


1
Grazie per un'ottima risposta Il mio obiettivo, infatti, è quello di fare "segmentazione di serie temporali" per ciascun veicolo nel mio set di dati.
Umair Durrani,

1
Sto studiando tutorial sulla scomposizione delle serie storiche. Ho scoperto che ci sono modi per scomporli in componenti di tendenza, stagionali e ciclici. Le mie serie storiche, tuttavia, sono pochi secondi delle traiettorie dei veicoli. È possibile scomporli in diversi componenti del comportamento di guida in base all'andamento di accelerazioni, velocità, velocità dei veicoli guida e accelerazioni all'interno di una traiettoria osservata?
Umair Durrani,

2
Può essere! per questo è meglio considerare sia la "decomposizione" che la "segmentazione". Ad esempio, se le tue serie temporali mostrano cluster significativi nello spazio del PC, puoi metterli in relazione con il comportamento di guida. La segmentazione serve anche a rilevare diversi comportamenti di guida all'interno di una serie temporale. Per farla breve, è possibile utilizzare la segmentazione per diversi segmenti di comportamento alla guida per un veicolo e tecniche di decomposizione per rilevare comportamenti di guida globali su tutti i veicoli.
Kasra Manshaei,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.