Ho cercato di capire come rappresentare e dati di forma per fare un multidimensionale e multivariata tempo serie previsione utilizzando Keras (o tensorflow), ma sono ancora molto poco chiaro dopo aver letto molti post del blog / tutorial / documentazione su come presentare i dati nel forma corretta (la maggior parte degli esempi è leggermente inferiore
Il mio set di dati:
- diverse città
- per il quale ho informazioni su come dire temperatura, traffico automobilistico, umidità
- per esempio gli ultimi 2 anni (un record per ogni giorno)
Cosa voglio fare: vorrei prevedere per ogni città le temperature che posso aspettarmi per il prossimo anno usando una versione forse in ritardo di temperatura, traffico automobilistico e umidità (ovviamente ci sarebbero molte altre funzionalità, ma questa è solo una esempio di pensiero).
Di cosa sono confuso: se ho 2 città, per le quali ho registrato 3 funzioni per 365 giorni. Come devo modellare il mio input in modo che il modello possa generare una previsione per 365 giorni per queste due città (ovvero 2 serie temporali di temperature per 365 giorni)?
Intuitivamente la forma del tensore sarebbe (?, 365, 3)
per 365 giorni e 3 funzioni. Ma non sono sicuro di cosa restare nella prima dimensione e, soprattutto, sarei sorpreso se dovesse essere per il numero di città. Allo stesso tempo, non ho idea di come specificare nel modello che deve comprendere correttamente le dimensioni.
Eventuali suggerimenti saranno utili. Conosco il resto del problema (ad es. Come si costruisce una rete in Keras ecc. Da quando l'ho fatto per altre reti neurali, ma più specificamente come codificare la sequenza per l'input desiderato)
Oh, e anche , immagino che potrei allenarmi e prevedere in modo indipendente per ogni città, ma sono sicuro che tutti saranno d'accordo sul fatto che probabilmente ci sono cose da imparare che non sono particolari per nessuna città ma che possono essere viste solo se si considerano molte di esse, quindi perché penso sia importante codificarlo nel modello.