Come hobby secondario, ho esplorato le serie temporali di previsione (in particolare, usando R).
Per i miei dati, ho il numero di visite al giorno, per ogni giorno che risale a quasi 4 anni fa. In questi dati ci sono alcuni schemi distinti:
- Dal lunedì al venerdì ci sono molte visite (il più alto il lunedì / il martedì), ma drasticamente meno il sabato e il sole.
- Alcuni periodi dell'anno calano (cioè molte meno visite nei giorni festivi degli Stati Uniti, le estati mostrano una crescita minore)
- Crescita significativa di anno in anno
Sarebbe bello poter prevedere un prossimo anno con questi dati e utilizzarlo anche per una crescita mensile su base destagionalizzata. La cosa principale che mi butta fuori con una vista mensile è:
- Alcuni mesi avranno più lunedì / martedì rispetto ad altri mesi (e questo non è coerente negli anni). Pertanto, un mese che accade a più giorni feriali deve essere adeguato di conseguenza.
Anche l'esplorazione delle settimane sembra difficile poiché i sistemi di numerazione delle settimane cambiano da 52 a 53 a seconda dell'anno, e sembra ts
non gestirla.
Sto meditando di prendere una media per i giorni feriali del mese, ma l'unità risultante è un po 'strana (crescita delle visite nei giorni feriali medi) e questo lascerebbe cadere i dati che sono validi.
Sento che questo tipo di dati sarebbe comune nelle serie temporali (ad esempio l'uso dell'elettricità nell'edificio per uffici potrebbe essere qualcosa del genere), qualcuno ha qualche consiglio su come modellarlo, in particolare in R?
I dati con cui sto lavorando sono piuttosto semplici, iniziano come:
[,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467
e continua così fino ai giorni nostri, con una tendenza generale alla crescita, alcuni cali nelle settimane di vacanza negli Stati Uniti e una crescita generalmente rallentata durante l'estate.
ts
(e persino msts
) non si adatta a un periodo di campionamento di una settimana con un periodo "naturale" di un anno (Nemmeno i calendari credo davvero). Oppure, non capisco come farlo funzionare ...