È accertato, almeno tra gli statistici di qualche livello superiore, che i modelli con i valori della statistica AIC entro una certa soglia del valore minimo dovrebbero essere considerati appropriati come il modello che minimizza la statistica AIC. Ad esempio, in [1, p.221] troviamo
Quindi i modelli con GCV di piccole dimensioni o AIC sarebbero considerati i migliori. Ovviamente non si dovrebbe semplicemente minimizzare alla cieca GCV o AIC. Piuttosto, tutti i modelli con valori GCV o AIC ragionevolmente piccoli dovrebbero essere considerati potenzialmente appropriati e valutati in base alla loro semplicità e rilevanza scientifica.
Allo stesso modo, in [2, p.144] abbiamo
È stato suggerito (Duong, 1984) che i modelli con valori AIC entro c del valore minimo debbano essere considerati competitivi (con c = 2 come valore tipico). La selezione tra i modelli della concorrenza può quindi basarsi su fattori quali il candore dei residui (sezione 5.3) e la semplicità del modello.
Riferimenti:
- Ruppert, D .; Wand, MP & Carrol, RJ Semiparametric Regression , Cambridge University Press, 2003
- Brockwell, PJ & Davis, RA Introduzione alle serie storiche e previsioni , John Wiley & Sons, 1996
Quindi, dato quanto sopra, quale dei due modelli seguenti dovrebbe essere preferito?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
Più in generale, quando è appropriato selezionare i modelli minimizzando ciecamente l'AIC o le relative statistiche?