Il problema con cui ho a che fare è prevedere i valori delle serie temporali. Sto guardando una serie temporale alla volta e, ad esempio, basandomi sul 15% dei dati di input, vorrei prevederne i valori futuri. Finora mi sono imbattuto in due modelli:
Ho provato entrambi e ho letto alcuni articoli su di essi. Ora sto cercando di capire meglio come confrontare i due. Quello che ho trovato finora:
- LSTM funziona meglio se abbiamo a che fare con enormi quantità di dati e se sono disponibili sufficienti dati di formazione, mentre ARIMA è migliore per set di dati più piccoli (è corretto?)
- ARIMA richiede una serie di parametri
(p,q,d)che devono essere calcolati in base ai dati, mentre LSTM non richiede l'impostazione di tali parametri. Tuttavia, ci sono alcuni iperparametri che dobbiamo sintonizzare per LSTM.
Oltre alle proprietà sopra menzionate, non sono riuscito a trovare altri punti o fatti che possano aiutarmi a selezionare il modello migliore. Le sarei davvero grato se qualcuno potesse aiutarmi a trovare articoli, documenti o altre cose (finora non ho avuto fortuna, solo alcune opinioni generali qua e là e niente basato su esperimenti).
Devo dire che originariamente mi occupo di streaming di dati, tuttavia per ora sto usando set di dati NAB che includono 50 set di dati con la dimensione massima di 20k punti dati.