Crescita mensile su base destagionalizzata con stagionalità settimanale sottostante


9

Come hobby secondario, ho esplorato le serie temporali di previsione (in particolare, usando R).

Per i miei dati, ho il numero di visite al giorno, per ogni giorno che risale a quasi 4 anni fa. In questi dati ci sono alcuni schemi distinti:

  1. Dal lunedì al venerdì ci sono molte visite (il più alto il lunedì / il martedì), ma drasticamente meno il sabato e il sole.
  2. Alcuni periodi dell'anno calano (cioè molte meno visite nei giorni festivi degli Stati Uniti, le estati mostrano una crescita minore)
  3. Crescita significativa di anno in anno

Sarebbe bello poter prevedere un prossimo anno con questi dati e utilizzarlo anche per una crescita mensile su base destagionalizzata. La cosa principale che mi butta fuori con una vista mensile è:

  • Alcuni mesi avranno più lunedì / martedì rispetto ad altri mesi (e questo non è coerente negli anni). Pertanto, un mese che accade a più giorni feriali deve essere adeguato di conseguenza.

Anche l'esplorazione delle settimane sembra difficile poiché i sistemi di numerazione delle settimane cambiano da 52 a 53 a seconda dell'anno, e sembra ts non gestirla.

Sto meditando di prendere una media per i giorni feriali del mese, ma l'unità risultante è un po 'strana (crescita delle visite nei giorni feriali medi) e questo lascerebbe cadere i dati che sono validi.

Sento che questo tipo di dati sarebbe comune nelle serie temporali (ad esempio l'uso dell'elettricità nell'edificio per uffici potrebbe essere qualcosa del genere), qualcuno ha qualche consiglio su come modellarlo, in particolare in R?

I dati con cui sto lavorando sono piuttosto semplici, iniziano come:

            [,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467

e continua così fino ai giorni nostri, con una tendenza generale alla crescita, alcuni cali nelle settimane di vacanza negli Stati Uniti e una crescita generalmente rallentata durante l'estate.


Un altro aspetto interessante dei dati è che ci sono eventi improvvisi che interrompono la tendenza generale della crescita di un periodo di circa un paio di mesi. In questo momento, però, dove sono nella fase in cui cerco di impostare correttamente la stagionalità, sto ignorando questo aspetto.
Kyle Brandt,

Inoltre, correggimi se non utilizzo correttamente la "stagionalità". Attualmente sto pensando che sia uno scalpiccio nell'unità di tempo che dico. Quindi "stagionalità settimanale" per me significa "Un modello che si ripete ogni settimana".
Kyle Brandt,

Hmm, suona familiare (-;

Vedi le risposte a stats.stackexchange.com/questions/14742/… . Potrebbe essere un punto di partenza.
Peter Ellis,

Forse al centro di questo c'è la combinazione di settimana + anno? Sembra ts(e persino msts) non si adatta a un periodo di campionamento di una settimana con un periodo "naturale" di un anno (Nemmeno i calendari credo davvero). Oppure, non capisco come farlo funzionare ...
Kyle Brandt,

Risposte:


5

Ho quindi modellato in qualche modo dati in ogni momento. Devi incorporare

  • giorno della settimana
  • effetti festivi (piombo, effetti contemporanei e lag)
  • giorni speciali del mese
  • forse venerdì prima di una vacanza o un lunedì dopo una vacanza
  • effetti settimanali
  • effetti mensili
  • Struttura ARIMA per rendere gli errori rumore bianco;
  • et.al. .

L'approccio statistico si chiama Modeling delle funzioni di trasferimento con DEection di intervento. Se desideri condividere i tuoi dati privatamente tramite dave@autobox.com o preferibilmente tramite SE, sarei più che lieto di mostrarti effettivamente le specifiche di un modello finale e migliorare la tua capacità di farlo da solo o almeno per aiutarti e altri per capire cosa bisogna fare e cosa si può fare. In entrambi i casi, esci più intelligente senza spendere alcun tesoro, sia esso moneta o tempo. Per saperne di più potresti leggere alcune delle mie altre risposte alle domande sulle serie storiche.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.