Sono interessato alla selezione del modello in un'impostazione di serie storiche. Per concretezza, supponiamo che io voglia selezionare un modello ARMA da un pool di modelli ARMA con diversi ordini di ritardo. L' intento finale è la previsione .
La selezione del modello può essere effettuata da
- convalida incrociata,
- utilizzo di criteri informativi (AIC, BIC),
tra gli altri metodi.
Rob J. Hyndman fornisce un modo per eseguire la convalida incrociata per le serie storiche . Per campioni relativamente piccoli, la dimensione del campione utilizzata nella validazione incrociata può essere qualitativamente diversa dalla dimensione del campione originale. Ad esempio, se la dimensione del campione originale è di 200 osservazioni, si potrebbe pensare di iniziare la convalida incrociata prendendo le prime 101 osservazioni ed espandendo la finestra a 102, 103, ..., 200 osservazioni per ottenere 100 risultati di convalida incrociata. Chiaramente, un modello ragionevolmente parsimonioso per 200 osservazioni potrebbe essere troppo grande per 100 osservazioni e quindi il suo errore di validazione sarà grande. Pertanto la convalida incrociata probabilmente favorirà sistematicamente modelli troppo parsimoniosi. Questo è un effetto indesiderato a causa della discrepanza nelle dimensioni del campione .
Un'alternativa alla validazione incrociata sta usando i criteri di informazione per la selezione del modello. Dato che mi interessa la previsione, utilizzerei AIC. Anche se AIC è asintoticamente equivalente a ridurre al minimo il MSE di previsione a un passo fuori campione per i modelli di serie storiche (secondo questo post di Rob J. Hyndman), dubito che questo sia rilevante qui dal momento che il campione le taglie a cui tengo non sono così grandi ...
Domanda: dovrei scegliere la validazione incrociata delle serie temporali AIC per campioni medio / piccoli?
Alcune domande correlate possono essere trovate qui , qui e qui .