Ho un modello di previsione per una serie storica e voglio calcolare il suo errore di predizione fuori campione. Al momento la strategia che sto seguendo è quella suggerita sul blog di Rob Hyndman (nella parte inferiore della pagina) che va così (supponendo una serie temporale e un set di allenamento di dimensioni ) k
- Adatta il modello ai dati e lascia che sia la previsione per la prossima osservazione.y t + k
- Calcola l'errore di previsione come .
- Ripetere l'operazione per
- Calcola l'errore quadratico medio come
La mia domanda è quanto devo preoccuparmi delle correlazioni a causa dei miei set di allenamento sovrapposti. In particolare, supponiamo di voler prevedere non solo il valore successivo, ma anche i valori m successivi , in modo da disporre di previsioni ed errori e voglio costruire una struttura a termini di errori di predizione.
Posso comunque ruotare in avanti di 1 la finestra dell'allenamento impostato oppure devo spostarla in avanti di ? Come cambiano le risposte a queste domande se c'è una significativa autocorrelazione nelle serie che sto prevedendo (presumibilmente si tratta di un processo a memoria lunga, ovvero la funzione di autocorrelazione decade come una legge di potenza piuttosto che esponenzialmente).
Gradirei una spiegazione qui, o collegamenti ad un posto in cui posso trovare risultati teorici sugli intervalli di confidenza attorno al MSE (o altre misure di errore).