Analisi delle serie storiche rispetto all'apprendimento automatico?

10

Solo una domanda generale. Se si dispone di dati sulle serie temporali, quando è meglio utilizzare le tecniche delle serie temporali (ovvero ARCH, GARCH, ecc.) Rispetto alle tecniche di apprendimento automatico / statistico (KNN, regressione)? Se c'è una domanda simile che esiste su crossvalidated, per favore indicami verso di esso - guardato e non riuscivo a trovarne uno.

time-series machine-learning

— Nagy
fonte

1

Rilevante: cs.stackexchange.com/questions/13937/…

— Anton Tarasenko il

9

I metodi tipici di apprendimento automatico presuppongono che i dati siano indipendenti e distribuiti in modo identico, il che non è vero per i dati delle serie temporali. Pertanto sono in svantaggio rispetto alle tecniche delle serie temporali, in termini di precisione. Per esempi di ciò, vedere le domande precedenti L' ordinamento di serie temporali per l'apprendimento automatico e la foresta casuale è troppo adatto .

— Tom Minka
fonte

Grazie per la risposta. Per approfondire il tuo punto di vista, sembra che l'apprendimento automatico sia più interessato a trovare relazioni tra i dati, mentre l'analisi delle serie temporali è più preoccupata di identificare correttamente le cause dei dati, vale a dire come i fattori stocastici li stanno influenzando. Sei d'accordo con questo?

— Nagy,

4

No, non sarei d'accordo con quel riassunto.

— Tom Minka,

4

Francis Diebold ha recentemente pubblicato "ML and Metrics VI: A Key Difference Between ML and TS Econometrics" sul suo blog. Sto fornendo una versione abbreviata di esso, quindi tutto il merito va a lui. (L'enfasi in grassetto è mia.)

[S] tatistical machine learning (ML) e econometrics (TS) di serie storiche hanno molto in comune. Ma c'è anche una differenza interessante: l'enfasi di ML sulla modellazione flessibile non parametrica della non linearità media-condizionata non gioca un ruolo importante in TS. <...>

[T] ecco pochissime prove dell'importante non linearità media-condizionata nella dinamica stazionaria della covarianza (decrescente, de-stagionale) della maggior parte delle serie storiche economiche. <...> In effetti posso pensare a un solo tipo di non linearità media-condizionale che è emersa come ripetutamente importante per (almeno alcune) serie storiche economiche: le dinamiche di commutazione Markov in stile Hamilton.

[Ovviamente c'è un elefante non lineare nella stanza: dinamiche di tipo GARCH stile Engle. Sono tremendamente importanti nell'econometria finanziaria, e talvolta anche nella macroeconometria, ma riguardano varianze condizionate, non mezzi condizionali.]

Quindi in sostanza ci sono solo due importanti modelli non lineari in TS, e solo uno di essi parla di dinamica media-condizionale. E soprattutto, sono entrambi strettamente parametrici, strettamente adattati alle caratteristiche specializzate dei dati economici e finanziari.

Quindi la conclusione è:

ML enfatizza le funzioni approssimative non lineari approssimative in modo non parametrico altamente flessibile. Ciò risulta doppiamente superfluo in TS: non c'è molta non linearità media-condizionale di cui preoccuparsi, e quando ce n'è di tanto in tanto, è tipicamente di natura altamente specializzata meglio approssimata in modo altamente specializzato (strettamente parametrico) .

Consiglio di leggere l'intero post originale qui .

— Richard Hardy
fonte

+1. Sono pienamente d'accordo con questa risposta. I metodi ML tipici sono caratterizzati da modelli non parametrici e presentano ipotesi molto rilassate mentre i modelli ARMA sono "strettamente parametrici".

— Digio,

2

Come ha sottolineato @Tom Minka, la maggior parte delle tecniche ML presuppone input iid. Ci sono alcune soluzioni però:

È possibile utilizzare tutti i campioni delle serie temporali precedenti all'interno della 'Memoria' del sistema come vettore di una caratteristica, ovvero: x = [x (t-1), x (t-2), ... x (tM)]. Tuttavia, questo ha 2 problemi: 1) a seconda del binning, potresti avere un vettore di funzionalità enorme 2- alcuni metodi richiedono che le funzioni all'interno del vettore di funzionalità siano indipendenti, il che non è il caso qui.
Esistono molte tecniche ML appositamente progettate per tali dati di serie temporali, ad esempio Hidden Markov Models, che sono stati utilizzati con successo per il rilevamento delle crisi, l'elaborazione del parlato, ecc ...
Infine, un approccio che ho adottato è quello di utilizzare le tecniche di "estrazione delle caratteristiche" per convertire un problema di regressione dinamica (che ha l'elemento del tempo) in uno statico. Ad esempio, l'approccio Principal Dynamics Mode (PDM) mappa il vettore della funzione passato passato ([x (t-1), x (t-2), ... x (tM)]) su uno statico ([v ( 1), v (2), .. v (L)]) contorcendo il passato con una banca del filtro lineare specifica per il sistema (i PDM), vedi Marmarelis, libro del 2004 o Marmarelis, Vasilis Z. "Metodologia di modellizzazione per sistemi fisiologici non lineari ". Annali di ingegneria biomedica 25.2 (1997): 239-251 ...

— DankMasterDan
fonte