Ho dati storici sulle vendite di una panetteria (ogni giorno, oltre 3 anni). Ora voglio costruire un modello per prevedere le vendite future (utilizzando funzionalità come giorni feriali, variabili meteorologiche, ecc.).
Come devo dividere il set di dati per adattare e valutare i modelli?
- Deve essere un treno cronologico / convalida / prova divisa?
- Dovrei quindi eseguire la sintonizzazione dell'iperparametro con il treno e il set di convalida?
- La convalida incrociata (nidificata) è una strategia errata per un problema relativo alle serie temporali?
EDIT
Ecco alcuni link che ho trovato dopo aver seguito l'URL suggerito da @ ene100:
- Rob Hyndman descrive "l'origine di previsione mobile" in teoria e in pratica (con codice R)
- altri termini per l' origine della previsione mobile sono "ottimizzazione dell'andamento in avanti" ( qui o qui ), "orizzonte mobile" o "origine in movimento"
- sembra che queste tecniche non saranno integrate in scikit-learn nel prossimo futuro, perché "la domanda e la seminalità di queste tecniche non sono chiare" (dichiarate qui ).
E questo è un altro suggerimento per la validazione incrociata di serie storiche.