Dopo aver letto uno dei "Suggerimenti per la ricerca" di RJ Hyndman sulla convalida incrociata e le serie storiche, sono tornato a una mia vecchia domanda che cercherò di formulare qui. L'idea è che in problemi di classificazione o regressione, l'ordinamento dei dati non è importante, e quindi è possibile utilizzare k -fold validazione incrociata. D'altra parte, nelle serie storiche, l'ordinamento dei dati è ovviamente di grande importanza.
Tuttavia, quando si utilizza una macchina di apprendimento modello per serie temporali di previsione, una strategia comune è quello di rimodellare la serie in una serie di "vettori di input-output" che, per un tempo t , hanno la forma ( y t - n + 1 , . . . , Y t - 1 , y t ; y t + 1 ) .
Ora, una volta terminato questo rimodellamento, possiamo considerare che non è necessario ordinare l'insieme risultante di "vettori input-output"? Se utilizziamo, ad esempio, una rete neurale feed-forward con n input per "apprendere" questi dati, arriveremmo agli stessi risultati indipendentemente dall'ordine in cui mostriamo i vettori al modello. E quindi, potremmo usare la validazione incrociata di k-fold in modo standard, senza la necessità di reinserire il modello ogni volta?