A pag. 34 del suo PRNN Brian Ripley commenta che "L'AIC è stato nominato da Akaike (1974) come" An Information Criterion "anche se sembra comunemente creduto che A sia l'acronimo di Akaike". Infatti, quando si introduce la statistica AIC, Akaike (1974, p. 719) lo spiega
"IC stands for information criterion and A is added so that similar statistics, BIC, DIC
etc may follow".
Considerando questa citazione come una previsione fatta nel 1974, è interessante notare che in soli quattro anni due tipi di statistica BIC (Bayesian IC) furono proposti da Akaike (1977, 1978) e Schwarz (1978). Ci sono voluti Spiegelhalter et al. (2002) molto più a lungo per presentare DIC (Deviance IC). Sebbene l'apparizione del criterio CIC non fosse stata predetta da Akaike (1974), sarebbe ingenuo credere che non sia mai stato contemplato. È stato proposto da Carlos C. Rodriguez nel 2005. (Notare che il CIC (Covariance Inflation Criterion) di R. Tibshirani e K. Knight è diverso).
Sapevo che EIC (Empirical IC) fu proposto da persone della Monash University intorno al 2003. Ho appena scoperto il Criterio informativo focalizzato (FIC). Alcuni libri si riferiscono a Hannan e Quinn IC come HIC, vedi ad esempio questo ). So che dovrebbe esserci GIC (Generalized IC) e ho appena scoperto l'Information Investing Criterion (IIC). C'è NIC, TIC e altro ancora.
Penso che potrei eventualmente coprire il resto dell'alfabeto, quindi non sto chiedendo dove si ferma la sequenza AIC, BIC, CIC, DIC, EIC, FIC, GIC, HIC, IIC, ... o quali lettere dell'alfabeto hanno non è stato utilizzato o è stato usato almeno due volte (ad es. E in EIC può essere esteso o empirico). La mia domanda è più semplice e spero sia praticamente utile. Posso usare queste statistiche in modo intercambiabile, ignorando le ipotesi specifiche in cui sono state derivate, le situazioni specifiche in cui avrebbero dovuto essere applicabili e così via?
Questa domanda è in parte motivata da Burnham & Anderson (2001) scrivendo che:
...the comparison of AIC and BIC model selection ought to be based on their performance
properties such as mean square error for parameter estimation (includes prediction) and
confidence interval coverage: tapering effects or not, goodness-of-fit issues,
derivation of theory is irrelevant as it can be frequentist or Bayes.
Il capitolo 7 della monografia di Hyndman et al. Sul livellamento esponenziale sembra seguire il consiglio BA quando si esamina il modo in cui i cinque circuiti integrati alternativi (AIC, BIC, AICc, HQIC, LEIC) si comportano nel selezionare il modello che prevede meglio (come misurato con una misura di errore recentemente proposta chiamata MASE) per concludere che l'AIC era un'alternativa migliore più spesso. (L'HQIC è stato segnalato come il miglior selettore di modelli solo una volta.)
Non sono sicuro di quale sia lo scopo utile degli esercizi di ricerca che trattano implicitamente tutti gli ICc come se fossero derivati per rispondere alla stessa domanda sotto serie equivalenti di ipotesi. In particolare, non sono sicuro di quanto sia utile investigare le prestazioni predittive del criterio coerente per determinare l'ordine di un'autoregressione (che Hannan e Quinn hanno derivato per sequenze stazionarie ergodiche) utilizzandolo nel contesto esponenziale non stazionario modelli di livellamento descritti e analizzati nella monografia di Hyndman et al. Mi sto perdendo qualcosa qui?
Riferimenti:
Akaike, H. (1974), Un nuovo sguardo all'identificazione del modello statistico, IEEE Transactions on Automatic Control 19 (6), 716-723.
Akaike, H. (1977), Principio di massimizzazione dell'entropia, in PR Krishnaiah, ed., Applicazioni di statistiche , vol. 27, Amsterdam: Olanda Settentrionale, pagg. 27-41.
Akaike, H. (1978), Un'analisi bayesiana della procedura minima AIC, Annals of the Institute of Statistical Mathematics 30 (1), 9-14.
Burnham, KP & Anderson, DR (2001) Le informazioni di Kullback-Leibler come base per una forte inferenza negli studi ecologici, Wildlife Research 28, 111-119
Hyndman, RJ, Koehler, AB, Ord, JK & Snyder, RD Previsione con livellamento esponenziale: l'approccio dello spazio degli stati. New York: Springer, 2008
Ripley, BD Pattern Recognition e reti neurali . Cambridge: Cambridge University Press, 1996
Schwarz, G. (1978), Stima della dimensione di un modello, Annals of Statistics 6 (2), 461-464.
Spiegelhalter, DJ, Best, NG, Carlin, BP e van der Linde, A. (2002), misure bayesiane della complessità del modello et (con discussione), Journal of the Royal Statistical Society. Serie B (metodologia statistica) 64 (4), 583-639.