Previsione di serie storiche usando ARIMA vs LSTM

Il problema con cui ho a che fare è prevedere i valori delle serie temporali. Sto guardando una serie temporale alla volta e, ad esempio, basandomi sul 15% dei dati di input, vorrei prevederne i valori futuri. Finora mi sono imbattuto in due modelli:

LSTM (memoria a breve termine; una classe di reti neurali ricorrenti)
ARIMA

Ho provato entrambi e ho letto alcuni articoli su di essi. Ora sto cercando di capire meglio come confrontare i due. Quello che ho trovato finora:

LSTM funziona meglio se abbiamo a che fare con enormi quantità di dati e se sono disponibili sufficienti dati di formazione, mentre ARIMA è migliore per set di dati più piccoli (è corretto?)
ARIMA richiede una serie di parametri (p,q,d)che devono essere calcolati in base ai dati, mentre LSTM non richiede l'impostazione di tali parametri. Tuttavia, ci sono alcuni iperparametri che dobbiamo sintonizzare per LSTM.

Oltre alle proprietà sopra menzionate, non sono riuscito a trovare altri punti o fatti che possano aiutarmi a selezionare il modello migliore. Le sarei davvero grato se qualcuno potesse aiutarmi a trovare articoli, documenti o altre cose (finora non ho avuto fortuna, solo alcune opinioni generali qua e là e niente basato su esperimenti).

Devo dire che originariamente mi occupo di streaming di dati, tuttavia per ora sto usando set di dati NAB che includono 50 set di dati con la dimensione massima di 20k punti dati.

— ahajib
fonte

Perché non provi semplicemente i due modelli su una parte dei tuoi dati, vedi quale è migliore nelle previsioni e sceglili. Oppure usa entrambi i modelli e combina le loro previsioni. Le combinazioni di previsioni spesso sovraperformano le singole previsioni.

— Richard Hardy,

@RichardHardy L'ho già fatto e sono consapevole delle loro prestazioni nei miei set di dati. Sto cercando di comprendere meglio entrambi, in particolare i loro svantaggi per vedere quale potrebbe essere il miglior candidato per gestire i prossimi campioni di dati.

— ahajib,

DS: Previsione di serie storiche usando ARIMA vs LSTM

— Franck Dernoncourt

Si prega di leggere il centro assistenza, in particolare il terzo ultimo paragrafo che dice " Si noti, tuttavia, che il cross-post non è incoraggiato sui siti SE. Scegliere una posizione migliore per pubblicare la domanda. Successivamente, se si rivela più adatto su un altro sito, può essere migrato. "

— Glen_b -Restate Monica

Confronto dei modelli di reti neurali artificiali e ARIMA per la previsione del prezzo delle

— azioni

Un confronto tra rete neurale artificiale e modelli di serie temporali per la previsione dei prezzi delle materie prime confronta le prestazioni di ANN e ARIMA nella previsione di serie temporali finanziarie. Penso che sia un buon punto di partenza per la tua revisione della letteratura.

In molti casi, le reti neurali tendono a sovraperformare i modelli basati su AR. Tuttavia, penso che uno dei principali svantaggi (che non è molto discusso nella letteratura accademica) con metodi di apprendimento automatico più avanzati sia l'uso di scatole nere. Questo è un grosso problema se dovessi spiegare come funziona il modello a qualcuno che non conosce gran parte di questi modelli (ad esempio in un'azienda). Ma se stai facendo questa analisi proprio come un lavoro scolastico, non penso che questo sarà un problema.

Ma come ha detto il commentatore precedente, di solito il modo migliore è formare uno stimatore di ensemble in cui si combinano due o più modelli.

— Juha
fonte

L'arbitro che hai citato riguarda semplici reti neurali feedforward ed è troppo vecchio per essere utile (gli anni '90 sono passati un secolo fa). La domanda del PO pone sulla rete neurale ricorrente con l'architettura LSTM e questo documento non lo copre.

— Orazio

Come accennato da @horaceT, questo documento è un po 'datato e se potessi suggerire un documento più recente che include informazioni sugli LSTM sarebbe fantastico. Grazie

— ahajib l'