RNN utilizzando più serie temporali


14

Sto cercando di creare una rete neurale usando serie temporali come input, al fine di addestrarlo in base al tipo di ogni serie. Ho letto che usando RNN puoi dividere l'input in batch e usare ogni punto della serie temporale in singoli neuroni e infine addestrare la rete.

Quello che sto cercando di fare è usare più serie temporali come input. Quindi, ad esempio, potresti ricevere input da due sensori. (Quindi due serie storiche), ma voglio usarle entrambe per ottenere un risultato finale.

Inoltre non sto cercando di prevedere i valori futuri delle serie storiche, sto cercando di ottenere una classificazione basata su tutti loro.

Come dovrei affrontare questo problema?

  • Esiste un modo per utilizzare più serie temporali come input per un RNN?

  • Dovrei provare a aggregare le serie storiche in una?

  • O dovrei semplicemente usare due diverse reti neurali? E se questo ultimo approccio è corretto, se il numero di serie temporali aumenta non sarebbe troppo intenso per il computer?

Risposte:


10

Le serie temporali multivariate sono un argomento di ricerca attivo che troverai molti articoli recenti che affrontano l'argomento.

Per rispondere alle tue domande, puoi utilizzare un singolo RNN. È possibile inserire un valore per ogni passaggio temporale. Nulla ti impedisce di aggiungere un altro valore ad ogni passaggio (se il sensore è sincronizzato). Il modello imparerà quindi come classificarsi con una serie temporale bidimensionale.

Controlla questo blog . Nel tuo caso, solo l'output è diverso.

Per quanto riguarda gli ultimi due punti, aggregare le serie storiche in una è rischioso, nel senso che potresti perdere informazioni importanti durante il processo. Infine, il principale svantaggio del tuo ultimo punto è che non sarai in grado di utilizzare una potenziale correlazione tra le due serie temporali per la classificazione finale.


Se si utilizzano più serie temporali, come reagirà la rete se per qualche motivo per campione1 si hanno 5 serie ma per campione2 si hanno 4, (forse perché non si hanno dati dall'ultimo sensore). È necessario che se inizi con 5 serie, dovrebbe essere sempre 5? Dovresti includere una quinta serie temporale per sample2 con dati falsi mediati per avere tutti e 5?
Ploo,

1
vabbè ci sono diversi approcci ai dati mancanti. Ti consiglierei di usare il valore 0 quando non hai valori. Viene spesso usato quando non abbiamo l'intera sequenza X_t ma dobbiamo comunque inserire una sequenza di lunghezza t. Si chiama imbottitura se si desidera saperne di più su questo.
Daerken,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.