Quando è appropriato selezionare i modelli minimizzando l'AIC?


12

È accertato, almeno tra gli statistici di qualche livello superiore, che i modelli con i valori della statistica AIC entro una certa soglia del valore minimo dovrebbero essere considerati appropriati come il modello che minimizza la statistica AIC. Ad esempio, in [1, p.221] troviamo

Quindi i modelli con GCV di piccole dimensioni o AIC sarebbero considerati i migliori. Ovviamente non si dovrebbe semplicemente minimizzare alla cieca GCV o AIC. Piuttosto, tutti i modelli con valori GCV o AIC ragionevolmente piccoli dovrebbero essere considerati potenzialmente appropriati e valutati in base alla loro semplicità e rilevanza scientifica.

Allo stesso modo, in [2, p.144] abbiamo

È stato suggerito (Duong, 1984) che i modelli con valori AIC entro c del valore minimo debbano essere considerati competitivi (con c = 2 come valore tipico). La selezione tra i modelli della concorrenza può quindi basarsi su fattori quali il candore dei residui (sezione 5.3) e la semplicità del modello.

Riferimenti:

  1. Ruppert, D .; Wand, MP & Carrol, RJ Semiparametric Regression , Cambridge University Press, 2003
  2. Brockwell, PJ & Davis, RA Introduzione alle serie storiche e previsioni , John Wiley & Sons, 1996

Quindi, dato quanto sopra, quale dei due modelli seguenti dovrebbe essere preferito?

print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787:  log likelihood = -27.09,  aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975:  log likelihood = -29.38,  aic = 64.76

Più in generale, quando è appropriato selezionare i modelli minimizzando ciecamente l'AIC o le relative statistiche?


Non hai fornito l'AIC per nessuno dei due modelli.
Peter Flom - Ripristina Monica

Ho mostrato come ottenerlo con R.
Hibernating l'

1
Problemi +1 nei modelli ARIMA indicati di seguito. Ma per il resto: "Semplificare un modello prognostico: uno studio di simulazione basato su dati clinici". Ambler 2002 è il riferimento più citato su questo.
charles,

Risposte:


4

Parafrasando dagli appunti delle lezioni di Cosma Shalizi sulla verità sulla regressione lineare , non sceglierai mai un modello solo perché è accaduto per minimizzare una statistica come AIC , perché

Every time someone solely uses an AIC statistic for model selection, an angel loses its
wings. Every time someone thoughtlessly minimises it, an angel not only loses its wings,
but is cast out of Heaven and falls in most extreme agony into the everlasting fire.

1
Come disse un famoso ebreo: "L'immaginazione è meglio della conoscenza" :)
letargo il

E, come ha detto un famoso non ebreo "Puoi vedere molto guardando" (Yogi Berra).
Peter Flom - Ripristina Monica

E ciò che vediamo, ovviamente, dipende principalmente da ciò che cerchiamo. --John Lubbock
Ibernazione il

12

Direi che spesso è appropriato usare l'AIC nella selezione dei modelli, ma raramente è giusto usarlo come unica base per la selezione dei modelli. Dobbiamo anche usare conoscenze sostanziali.

Nel tuo caso particolare, stai confrontando un modello con un AR del 3 ° ordine con uno con un AR del 1 ° ordine. Oltre ad AIC (o qualcosa di simile) esaminerei i grafici di autocorrelazione e di autocorrelazione parziale. Vorrei anche prendere in considerazione ciò che un modello di 3 ° ordine avrebbe significato . Ha senso? Si aggiunge alla conoscenza sostanziale? (Oppure, se sei interessato solo alla previsione, aiuta a prevedere?)

Più in generale, a volte è interessante trovare una dimensione di effetto molto piccola.


Hai appena detto che qualsiasi buon algoritmo per la selezione di un modello arima non dovrebbe basarsi esclusivamente sul criterio AIC (o simili)?
Ibernazione l'


E a questo fine l'ho sentito dire addio auto.arima. La mia preferenza sarebbe quella di seguire un approccio delineato nel capitolo 6 di Bisgaard, S. & Kulahci, M. Analisi delle serie temporali e previsioni con l'esempio John Wiley & Sons, Inc., 2011, ancora più precisamente nella sezione 6.5 FUNZIONE DI RISPOSTA DELL'IMPULSO ALLO STUDIO LE DIFFERENZE NEI MODELLI
letargo il

1
@Hibernating: Gli autori di auto.arima, Hyndman & Khandakar (2008) , affermano: - "Le previsioni automatiche di un gran numero di serie temporali univariate sono spesso necessarie nel mondo degli affari. È comune avere più di mille linee di prodotti che necessitano di previsioni almeno mensili. Anche quando è richiesto un numero inferiore di previsioni, potrebbe non esserci nessuno adeguatamente addestrato all'uso dei modelli di serie storiche per produrli. In queste circostanze, un algoritmo di previsione automatica è uno strumento essenziale. " Nota queste circostanze .
Scortchi - Ripristina Monica

2
Grazie ma l'avevo letto prima. Anche se per il momento ignoriamo gli ovvi problemi con la parte "auto", ci sono problemi con la parte "arima", specialmente quando viene estesa per includere modelli stagionali. I modelli ARIMA stagionali sono stati fortemente criticati da PJ Harrison, C Chatfield e alcune altre personalità da cui mi è piaciuto imparare. Non ho nulla contro la previsione automatica quando è i) assolutamente necessario e ii) sulla base di algoritmi riesco a trovare il suono - altrimenti seguo i consigli di DR Cox nel suo commento sul documento "due culture" di Leo Breiman su Stat Science qualche anno fa.
letargo l'

8

PP


2
La tua ultima frase è interessante. Ricordo di aver letto che l'aggiunta di predittori anche insignificanti alla regressione potrebbe essere giustificata se lo scopo ultimo è la previsione. Non ho prestato molta attenzione al momento, ma ora proverò a trovare quel riferimento.
Ibernazione l'

3
Invece di aggiungere , direi di evitare di rimuoverlo . E non è solo una previsione, ma l'uso delle valutazioni delle associazioni statistiche per guidare la selezione delle variabili causa errori e limiti standard non validi.
Frank Harrell,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.