Ho una variabile continua, campionata per un periodo di un anno a intervalli irregolari. Alcuni giorni hanno più di un'osservazione all'ora, mentre altri periodi non hanno nulla per giorni. Ciò rende particolarmente difficile rilevare i modelli nelle serie temporali, perché alcuni mesi (ad esempio ottobre) sono altamente campionati, mentre altri no.
La mia domanda è: quale sarebbe l'approccio migliore per modellare questa serie temporale?
- Credo che la maggior parte delle tecniche di analisi delle serie storiche (come ARMA) necessiti di una frequenza fissa. Potrei aggregare i dati, al fine di avere un campione costante o scegliere un sottoinsieme dei dati che è molto dettagliato. Con entrambe le opzioni mi mancheranno alcune informazioni dal set di dati originale, che potrebbero svelare schemi distinti.
- Invece di scomporre la serie in cicli, potrei alimentare il modello con l'intero set di dati e aspettarmi che raccolga gli schemi. Ad esempio, ho trasformato l'ora, il giorno della settimana e il mese in variabili categoriali e ho provato una regressione multipla con buoni risultati (R2 = 0,71)
Ho l'idea che anche le tecniche di apprendimento automatico come ANN possano scegliere questi schemi da serie temporali irregolari, ma mi chiedevo se qualcuno ci avesse provato e potesse darmi qualche consiglio sul modo migliore di rappresentare gli schemi temporali in una rete neurale.