Esiste un gold standard per la modellazione di serie temporali con spaziatura irregolare?


45

Nel campo dell'economia (penso) abbiamo ARIMA e GARCH per serie temporali a intervalli regolari e Poisson, Hawkes per i processi di punti di modellizzazione, quindi che ne dite di tentativi di modellazione di serie temporali a spaziatura irregolare - esistono (almeno) pratiche comuni ?

(Se hai qualche conoscenza in questo argomento puoi anche espandere l' articolo wiki corrispondente .)

Edizione (sui valori mancanti e le serie temporali a spaziatura irregolare):

Rispondi al commento di @Lucas Reis. Se gli spazi tra le misurazioni o le realizzazioni della variabile sono distanziati a causa (ad esempio) del processo di Poisson non c'è molto spazio per questo tipo di regolarizzazione, ma esiste una semplice procedura: t(i)è l'i-esimo indice temporale della variabile x (i-esimo tempo di realizzazione x), indicare lacune tra i tempi di misurazione come g(i)=t(i)-t(i-1), allora discretizzare g(i)utilizzando costante c, dg(i)=floor(g(i)/ce creare nuove serie temporali con il numero di valori vuoti tra vecchi osservazioni della serie originale tempo ie i+1uguale alla DG (i), ma il problema è che questo la procedura può facilmente produrre serie temporali con un numero di dati mancanti molto più grande del numero di osservazioni, quindi la stima ragionevole dei valori delle osservazioni mancanti potrebbe essere impossibile e troppo grandeceliminare "struttura temporale / dipendenza temporale ecc." del problema analizzato (il caso estremo è dato dal prendere c>=max(floor(g(i)/c))semplicemente collassare serie temporali spaziate irregolarmente in intervalli regolari

Edizione2 (solo per divertimento): contabilità delle immagini per i valori mancanti in serie temporali con spaziatura irregolare o anche caso di processo puntuale.


Giusto per chiarire, quando dici "spaziatura irregolare" non intendi "spaziatura regolare ma con valori mancanti", giusto?
Wayne,

2
No :) t(i)- tempo x[t(i)],x[t(i+1)],x[t(i+2)]...e t(j+1)-t(j)non è costante. I dati vengono raccolti in un maniero distribuito o asincrono.
Qbik,


2
Che dire di interpolare e fare l'analisi con i valori interpolati, spaziati regolarmente? Qualcuno sa quali sarebbero le implicazioni di questo metodo?
Lucas Reis,

Che dire della prima modellazione dei tempi dei punti e quindi dei valori dei punti, a seconda dei loro tempi? Credo che il termine sia "processi a punti marcati".
Peter R

Risposte:


26

Se le osservazioni di un processo stocastico sono spaziate in modo irregolare, il modo più naturale per modellare le osservazioni è come osservazioni temporali discrete da un processo temporale continuo.

Ciò che è generalmente necessario per una specifica del modello è la distribuzione congiunta delle osservazioni osservate a volte , e questo può, ad esempio, essere suddiviso in distribuzioni condizionali di dato . Se il processo è un processo Markov, questa distribuzione condizionale dipende da non da e dipende da e . Se il processo è omogeneo nel tempo, la dipendenza dai punti temporali è solo attraverso la loro differenza .X1,,Xnt1<t2<<tnXiXi1,,X1Xi1 Xi2,,X1 titi1titi1

Vediamo da ciò che se abbiamo osservazioni equidistanti (con , diciamo) da un processo di Markov omogeneo nel tempo, dobbiamo solo specificare una singola distribuzione di probabilità condizionata, , per specificare un modello. Altrimenti dobbiamo specificare un'intera collezione di distribuzioni condizionali di probabilità indicizzate dalle differenze temporali delle osservazioni per specificare un modello. Quest'ultimo, infatti, viene fatto più facilmente specificando una famiglia di distribuzioni di probabilità condizionate temporali continue.titi1=1P1Ptiti1Pt

Un modo comune per ottenere una specifica del modello di tempo continuo è attraverso un'equazione differenziale stocastica (SDE) Un buon punto di partenza per fare statistiche per i modelli SDE è Simulazione e inferenza per equazioni differenziali stocastiche di Stefano Iacus. È possibile che vengano descritti molti metodi e risultati per osservazioni equidistanti, ma questo è in genere solo conveniente per la presentazione e non essenziale per l'applicazione. Un ostacolo principale è che le specifiche SDE raramente consentono una probabilità esplicita quando si hanno osservazioni discrete, ma ci sono alternative di equazione di stima ben sviluppate.

dXt=a(Xt)dt+b(Xt)dBt.

Se si desidera andare oltre i processi di Markov, i modelli di volatilità stocastica sono come i modelli (G) ARCH che tentano di modellare una varianza eterogenea (volatilità). Si possono anche considerare equazioni di ritardo come che sono analoghi temporali continui dei AR . ( p )

dXt=0ta(s)(XtXs)ds+σdBt
(p)

Penso che sia giusto affermare che la pratica comune quando si tratta di osservazioni in punti temporali irregolari è quella di costruire un modello stocastico a tempo continuo.


1
GARCH non è un processo di volatilità stocastica. Il vol in GARCH è completamente determinato per questo periodo dalle osservazioni nei periodi precedenti.
Aksakal,

12

Per le serie temporali a spaziatura irregolare è facile costruire un filtro Kalman .

C'è un documento su come trasferire ARIMA nella forma dello spazio degli stati qui

(1)

(1)


Mi dispiace, non ho accesso a quell'ultimo documento, potresti aiutarmi con me?
Quarzo

2
Ho aggiunto la citazione così è facile da trovare - c'è anche una prestampa qui: eprints.soton.ac.uk/147383
bdecaf

L'articolo sul trasferimento di ARIMA nello spazio degli stati sembra avere un collegamento interrotto.
ofey73

9

Quando stavo cercando un modo per misurare la quantità di fluttuazione dei dati campionati in modo irregolare, mi sono imbattuto in questi due articoli sul livellamento esponenziale dei dati irregolari di Cipra [ 1 , 2 ]. Questi si basano ulteriormente sulle tecniche di smoothing di Brown, Winters e Holt (vedi la voce Wikipedia per Exponential Smoothing ) e su un altro metodo di Wright (vedi paper per i riferimenti). Questi metodi non assumono molto sul processo sottostante e funzionano anche per i dati che mostrano fluttuazioni stagionali.

Non so se uno di questi conta come un 'gold standard'. Per il mio scopo, ho deciso di usare il livellamento esponenziale a due vie (singolo) seguendo il metodo di Brown. Mi è venuta l'idea di appianare in due modi la lettura del sommario su un documento dello studente (che non riesco a trovare ora).


7

L'analisi di serie temporali campionate in modo irregolare può essere complicata, in quanto non sono disponibili molti strumenti. A volte la pratica è applicare algoritmi regolari e sperare per il meglio. Questo non è necessariamente l'approccio migliore. Altre volte le persone cercano di interpolare i dati nelle lacune. Ho anche visto casi in cui le lacune sono riempite con numeri casuali che hanno la stessa distribuzione dei dati noti. Un algoritmo specifico per le serie campionate in modo irregolare è il periodogramma Lomb-Scargle che fornisce un periodogramma (pensa allo spettro di potenza) per le serie temporali campionate in modo non uniforme. Lomb-Scargle non richiede alcun "condizionamento del gap".


3

Se si desidera un modello di dominio del tempo "locale" - al contrario di stimare funzioni di correlazione o spettri di potenza), dire per rilevare e caratterizzare impulsi transitori, salti e simili - quindi l'algoritmo Bayesian Block potrebbe essere utile. Fornisce una rappresentazione costante a tratti ottimale delle serie temporali in qualsiasi modalità dati e campionamento spaziato arbitrariamente (in modo non uniforme). Vedere

"Studi sull'analisi delle serie storiche astronomiche. VI. Rappresentazioni di blocchi bayesiani", Scargle, Jeffrey D .; Norris, Jay P .; Jackson, Brad; Chiang, James, Astrophysical Journal, Volume 764, 167, 26 pp. (2013). http://arxiv.org/abs/1207.5578


2

RJMartin, "Segnali campionati in modo irregolare: teorie e tecniche di analisi", tesi di dottorato, UCL, 1998, disponibile online. Il capitolo 4 tratta dei modelli autoregressivi e sviluppa l'argomento dalla prospettiva del tempo continuo, come hanno affermato altri post.


1

La sezione 4.10 di J.Durbin, SJKoopman, Time Series Analysis by State Space Methods , 2a edizione, 2012, è dedicata alla modellistica nelle circostanze delle osservazioni mancanti.


1

Nell'analisi dei dati spaziali i dati vengono per lo più campionati irregolarmente nello spazio. Quindi un'idea sarebbe quella di vedere cosa viene fatto lì e implementare la stima del variogramma, il kriging e così via per il dominio "tempo" unidimensionale. I varigrammi potrebbero essere interessanti anche per i dati di serie temporali regolarmente distanziati, poiché hanno proprietà diverse dalla funzione di autocorrelazione ed è definito e significativo anche per i dati non stazionari.

Ecco un documento (in spagnolo) e qui un altro.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.