L'istruzione 1 è corretta, l'istruzione 2 è corretta, ma richiede l'elaborazione e l'istruzione 3 non è corretta per ARIMA stagionale:
Quanto segue potrebbe indicarti la giusta direzione, ma spero che otterrai qualche risposta in più con maggiore profondità nell'arena di LSTM.
Dici che hai provato entrambi gli algoritmi e che stai semplicemente cercando di capire quale sia il migliore, il che mi porta a pensare che potresti avere più problemi con il processo di scienza dei dati e la convalida incrociata rispetto alle specifiche dei modelli.
Serie storiche in generale:
Le serie storiche, in generale, sono difficili da prevedere. Se fossero facili da prevedere, tutti i data scientist sarebbero ricchi, avendo accuratamente previsto il valore di tutti gli stock. La realtà è che gli hedge fund, in media, non hanno sovraperformato il mercato e che la previsione delle serie storiche è in genere molto scarsa e si applica solo a durate molto brevi. I problemi principali sono che c'è molto rumore, ci sono molte influenze nascoste, i modelli sono eccessivamente semplicistici, gli influenzatori non si comportano come pensiamo che dovrebbero, l'interazione tra linearità e non linearità è sottile e confusa, ... all'infinito.
ARIMA
Sei errato nella tua valutazione secondo cui ARIMA richiede serie temporali fisse su cui prevedere. ARIMA non stagionale ha tre valori di input che aiutano a controllare ARIMA , stazionarietà e previsione (p, d, q), dove:
- p è il numero di termini autoregressivi,
- d è il numero di differenze non stagionali necessarie per la stazionarietà, e
- q è il numero di errori di previsione ritardati nell'equazione di previsione.
Al contrario ARIMA stagionale ha sei valori di input ARIMA (p, d, q, P, D, Q), dove:
- P è il numero di termini autoregressivi stagionali,
- D è il numero di differenze stagionali e
- Q è il numero di termini della media mobile stagionale.
Fatte salve le dichiarazioni di qualificazione di cui sopra, suggerisco di giocare con ARIMA stagionale per avere un'idea delle complessità coinvolte nel livellamento, nella rimozione della stagione, nella riduzione della tendenza, nella riduzione del rumore e nelle previsioni.
LSTM
Non so abbastanza su LSTM per aggiungere molto qui. Aggiungerò che le bandiere rosse tendono ad essere sollevate quando qualcuno inizia l'esercizio della scienza dei dati con l'apprendimento profondo. Ti suggerisco di imparare il più possibile usando ARIMA e quindi applicare alcune delle tue competenze ARIMA per aiutarti a imparare LSTM. Le reti neurali possono essere uno strumento molto potente, ma esse:
- può richiedere molto tempo per l'esecuzione,
- spesso richiedono più dati per l'addestramento rispetto ad altri modelli e
- hanno molti parametri di input da mettere a punto.
Convalida incrociata e modelli di confronto:
Le serie temporali sono divertenti in quanto tutti i dati di allenamento possono di solito essere trasformati in set di addestramento di apprendimento supervisionato. Once può semplicemente prendere una serie storica e tornare indietro nel tempo. Cioè ... scegli un momento e fai finta di non avere dati aggiuntivi, quindi produci una previsione e vedi quanto hai fatto bene. Puoi marciare attraverso le serie temporali facendo questo volte per ottenere una valutazione delle prestazioni del tuo modellon e per confrontare i modelli prendendo le precauzioni necessarie per evitare un eccesso di adattamento .
Spero che questo aiuti e buona fortuna!