Sto utilizzando una serie temporale giornaliera di dati sulle vendite che contiene circa 2 anni di punti dati giornalieri. Sulla base di alcuni tutorial / esempi online ho cercato di identificare la stagionalità nei dati. Sembra che vi sia una periodicità / stagionalità settimanale, mensile e probabilmente annuale.
Ad esempio, ci sono giorni di paga, in particolare il primo giorno di paga del mese con effetto che dura alcuni giorni durante la settimana. Ci sono anche alcuni effetti festivi specifici, chiaramente identificabili osservando le osservazioni.
Dotato di alcune di queste osservazioni, ho provato quanto segue:
ARIMA (con
Arima
eauto.arima
dal pacchetto R-forecast), utilizzando regressor (e altri valori predefiniti necessari nella funzione). Il regressore che ho creato è sostanzialmente una matrice di valori 0/1:- 11 mesi (n-1) variabili
- 12 variabili vacanza
- Impossibile capire la parte del giorno di paga ... dal momento che è un effetto leggermente più complicato di quanto pensassi. L'effetto payday funziona in modo diverso, a seconda del giorno della settimana del 1 ° mese.
Ho usato 7 (cioè la frequenza settimanale) per modellare le serie temporali. Ho provato il test, prevedendo 7 giorni alla volta. I risultati sono ragionevoli: l'accuratezza media per una previsione di 11 settimane arriva alla media RMSE settimanale al 5%.
Modello TBATS (dal pacchetto R-forecast) - utilizza la stagionalità multipla (7, 30.4375, 365.25) e ovviamente nessun regressore. La precisione è sorprendentemente migliore rispetto al modello ARIMA con una media settimanale del RMSE del 3,5%.
In questo caso, il modello senza errori ARMA ha prestazioni leggermente migliori. Ora, se applico i coefficienti solo per gli effetti natalizi del modello ARIMA descritti nel n. 1, ai risultati del modello TBATS il RMSE settimanale avg migliora del 2,95%
Ora, senza avere molti retroscena o conoscenza delle teorie alla base di questi modelli, sono in un dilemma se questo approccio TBATS sia anche valido. Anche se sta migliorando significativamente l'RMSE nel test di 11 settimane, mi chiedo se possa sostenere questa precisione in futuro. O anche se l'applicazione degli effetti vacanza di ARIMA al risultato TBATS è giustificabile. Qualsiasi pensiero da parte di tutti / tutti i collaboratori sarà molto apprezzato.
Nota: eseguire "Salva collegamento come" per scaricare il file.