Qual è il modo migliore per dividere i dati delle serie temporali in set di treni / test / validazione, dove il set di validazione verrebbe utilizzato per l'ottimizzazione dell'iperparametro?
Abbiamo 3 anni di dati sulle vendite giornaliere e il nostro piano è di utilizzare il 2015-2016 come dati di formazione, quindi campionare casualmente 10 settimane dai dati 2017 da utilizzare come set di convalida e altre 10 settimane dai dati 2017 per il set di test. Faremo quindi un passo avanti in ciascuno dei giorni nel set di test e convalida.