Sto usando i modelli R (3.1.1) e ARIMA per le previsioni. Vorrei sapere quale dovrebbe essere il parametro "frequenza", che è assegnato nella ts()
funzione , se sto usando dati di serie temporali che sono:
- separato da minuti e si sviluppa su 180 giorni (1440 minuti / giorno)
- separato da secondi e si sviluppa su 180 giorni (86.400 secondi / giorno).
Se ricordo bene la definizione, una "frequenza" in ts in R, è il numero di osservazioni per "stagione".
Domanda parte 1:
Qual è la "stagione" nel mio caso?
Se la stagione è "giorno", allora la "frequenza" è per minuti = 1440 e 86.400 per secondi?
Domanda parte 2:
La "frequenza" potrebbe anche dipendere da ciò che sto cercando di raggiungere / prevedere? ad esempio, nel mio caso, vorrei avere una previsione a breve termine. Un passo avanti di 10 minuti ogni volta. Sarebbe quindi possibile considerare la stagione come un'ora anziché un giorno? In tal caso frequenza = 60 per minuti, frequenza = 3600 per secondi?
Ho provato ad esempio ad utilizzare la frequenza = 60 per i dati minuti e ho ottenuto risultati migliori rispetto alla frequenza = 1440 (usato fourier
vedi link sotto da Hyndman)
http://robjhyndman.com/hyndsight/forecasting-weekly-data/
(Il confronto è stato effettuato utilizzando MAPE per la misura dell'accuratezza della previsione)
Nel caso in cui i risultati siano completamente arbitrari e la frequenza non possa essere modificata. Quale sarebbe in realtà l'interpretazione dell'utilizzo di freq = 60 sui miei dati?
Penso anche che valga la pena ricordare che i miei dati contengono stagionalità ad ogni ora e ogni due ore (osservando i dati grezzi e la funzione di autocorrelazione)