mentre passo alle previsioni con i modelli ARIMA, sto cercando di capire come posso migliorare una previsione basata sull'ARIMA in base alla stagionalità e alla deriva.
I miei dati sono le seguenti serie temporali (oltre 3 anni, con chiara tendenza al rialzo e stagionalità visibile, che sembra non essere supportata dall'autocorrelazione in ritardo di 12, 24, 36 ??).
> bal2sum3years.ts
Jan Feb Mar Apr May Jun Jul Aug
2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729
2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888
2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416
Sep Oct Nov Dec
2010 2232261 2394644 2468479 2816287
2011 2480940 2699780 2760268 3206372
2012 2951516 3119176 3032960 3738256
Il modello che mi è stato suggerito auto.arima(bal2sum3years.ts)
mi ha dato il seguente modello:
Series: bal2sum3years.ts
ARIMA(0,0,0)(0,1,0)[12] with drift
Coefficients:
drift
31725.567
s.e. 2651.693
sigma^2 estimated as 2.43e+10: log likelihood=-321.02
AIC=646.04 AICc=646.61 BIC=648.39
Tuttavia, acf(bal2sum3years.ts,max.lag=35)
non mostra coefficienti di acf superiori a 0,3. La stagionalità dei dati è, tuttavia, abbastanza ovvia - picco all'inizio di ogni anno. Ecco come appare la serie sul grafico:
La previsione usando fit=Arima(bal2sum3years.ts,seasonal=list(order=c(0,1,0),period=12),include.drift=TRUE)
, chiamata per funzione forecast(fit)
, fa sì che i mezzi dei prossimi 12 mesi siano uguali agli ultimi 12 mesi dei dati più costante. Questo può essere visto chiamando plot(forecast(fit))
,
Ho anche controllato i residui, che non sono autocorrelati ma hanno media positiva (diversa da zero).
La misura non modella esattamente le serie storiche originali, a mio avviso (blu le serie storiche originali, il rosso è il fitted(fit)
:
La pensione è: il modello non è corretto? Mi sto perdendo qualcosa? Come posso migliorare il modello? Sembra che il modello impieghi letteralmente gli ultimi 12 mesi e aggiunge una costante per raggiungere i prossimi 12 mesi.
Sono un principiante relativo nei modelli e nelle statistiche di previsione di serie storiche.