Come codificare la data e l'ora di un evento per una rete neurale?
Non ho una serie temporale continua, ma alcuni eventi con data e ora e analizzo un qualche tipo di interesse. Questo interesse differisce tra mattina e sera e differisce tra i giorni feriali e tra estate e inverno, prima di Natale e Pasqua e così via. E gli eventi stessi hanno una forte distribuzione non uniforme nel tempo (più di giorno che di notte, alcuni più durante la settimana, altri durante il fine settimana).
Ho provato a codificarlo come numero di settimana dell'anno, come giorno 1-7 e come ora del giorno. Ma giocare con un autoencoder sparso mi ha dato l'impressione che i miei dati non abbiano alcun senso per una rete neurale, non potevano nemmeno riprodurre nulla vicino all'ingresso anche con un grande strato nascosto. Né come 0-1 categoriale né come valori normalizzati.
Ma cercare la codifica del tempo per una rete neurale fornisce principalmente informazioni sulle serie temporali, quindi sono un po 'bendato dalla foresta ma alla ricerca dell'albero.
Certo, potrei guardare i dati e classificarli approssimativamente in modo più o meno dispotico. Ma il concetto di Deep Learning sembra spazzare via tutta l'estrazione manuale manuale delle caratteristiche. E la categorizzazione inserirebbe grandi salti in una variabile di input naturalmente continua.
La mia "codifica naturale" nel mio cervello è più simile a un'appartenenza sfocata ad alcune categorie come "notte", "mattina", "giorno della settimana" e così via.
Per rendere il tutto più interessante, anche la variabile di dipendenza contiene quei dati di data / ora, ma questa è una domanda diversa.
EDIT: in qualche modo legati al tipo ciclico di dati ci sono alcune domande recenti, come
Quali test statistici sono ragionevoli con questo set di dati dell'ora del giorno?