Come si esegue il bootstrap con i dati delle serie temporali?


33

Di recente ho imparato a utilizzare le tecniche di bootstrap per calcolare errori standard e intervalli di confidenza per gli stimatori. Quello che ho imparato è che se i dati sono IID, puoi trattare i dati del campione come popolazione e fare il campionamento con la sostituzione e questo ti permetterà di ottenere più simulazioni di una statistica di test.

Nel caso delle serie storiche, chiaramente non è possibile farlo poiché è probabile che esista l'autocorrelazione. Ho una serie temporale e vorrei calcolare la media dei dati prima e dopo una data fissa. Esiste un modo corretto per farlo utilizzando una versione modificata del bootstrap?


16
Termine di ricerca chiave: blocco bootstrap.
cardinale

Risposte:


26

Come sottolinea @cardinal, le variazioni sul "blocco del bootstrap" sono un approccio naturale. Qui, a seconda del metodo, si selezionano tratti delle serie temporali, sovrapposte o meno e di lunghezza fissa o casuale, che possono garantire la stazionarietà nei campioni ( Politis e Romano, 1991 ), quindi ricucirli insieme per creare serie temporali ricampionate su cui calcoli la tua statistica. Puoi anche provare a costruire modelli delle dipendenze temporali, portando a metodi di Markov, setacci autoregressivi e altri. Ma il blocco del bootstrap è probabilmente il più semplice di questi metodi da implementare.

Gonçalves and Politis (2011) è una recensione molto breve con riferimenti. Un trattamento di lunghezza del libro è Lahiri (2010) .


@statnub Se questo è correlato alla tua precedente domanda di intervento settimanale sulle vendite, tieni presente che avresti avviato il bootstrap se non ti fidi delle ipotesi del modello che stavi distribuendo lì. L'uso di un modello di serie storiche giustificabile in primo luogo dovrebbe idealmente ridurre al minimo il rischio di cose che indicherebbero questo tipo di bootstrap ...
conjugateprior

6
Buona risposta. Vorrei solo aggiungere che è possibile utilizzare tsbootnel bootpacchetto in R per fare questo.
Martedì

@ MånsT Nice. Non sapevo di quel pacchetto.
conjugateprior

5

Il metodo di ricampionamento introdotto in Efron (1979) è stato progettato per i dati univariati ma è facilmente esteso ai dati multivariati. Come discusso in. Se è un campione di vettori, per mantenere la struttura di covarianza dei dati nel campione. Non è immediatamente ovvio se si può ricampionare una serie temporale . Una serie temporale è essenzialmente un campione di dimensione 1 proveniente da un processo stocastico. Il ricampionamento di un campione è un campione originale, quindi non si impara nulla dal ricampionamento. Pertanto, il ricampionamento di una serie storica richiede nuove idee.x1,···,xnx1,x2,···,xn

Il ricampionamento basato su modello è facilmente adottato per le serie storiche. I campioni vengono ottenuti simulando il modello di serie storiche. Ad esempio, se il modello è ARIMA (p, d, q), i campioni di un modello ARIMA (p, q) con MLE (dalle serie differenziate) dei coefficienti di media autoregressiva e mobile e della varianza del rumore. I campioni sono le sequenze della somma parziale del processo ARIMA simulato (p, q).

Il ricampionamento senza modello delle serie temporali è realizzato dal ricampionamento a blocchi, chiamato anche blocco bootstrap, che può essere implementato usando la funzione tsboot nel pacchetto di avvio di R. L'idea è quella di spezzare la serie in blocchi approssimativamente della stessa lunghezza di osservazioni consecutive, ricampionare il blocco con la sostituzione e quindi incollare i blocchi insieme. Ad esempio, se la serie temporale è di lunghezza 200 e si usano 10 blocchi di lunghezza 20, i blocchi sono le prime 20 osservazioni, le successive 20 e così via. Un possibile ricampionamento è il quarto blocco (osservazione da 61 a 80), quindi l'ultimo blocco (osservazione da 181 a 200), quindi il secondo blocco (osservazione da 21 a 40), quindi di nuovo il quarto blocco e così via fino a quando non ci sono 10 blocchi nel ricampionamento.


1
Esistono altre forme di metodi bootstrap a blocchi tra cui bootstrap a blocchi sovrapposti e bootstrap a blocchi circolari che sono descritti in dettaglio nel libro di Lahiri (2003) "Metodi di ricampionamento per dati dipendenti". Questi metodi sono applicabili a serie storiche stazionarie.
Michael R. Chernick l'
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.