Si può raccomandare il libro di Burnham-Anderson sull'inferenza del modello multiplo?


14

Come motivato dal recente cambiamento della statistica di selezione del modello predefinito nel pacchetto di previsione di R da AIC ad AICc, sono curioso di sapere se quest'ultimo sia effettivamente applicabile ovunque sia il primo. Ho una serie di domande al riguardo ed ecco la prima.

So che sostituire AIC con AICc ovunque è ciò che raccomanda il famoso libro in (1) di Burnham e Anderson (non statistici), come riassunto qui . A volte il libro è citato acriticamente da giovani statistici, vedi ad esempio i commenti a questo post sul blog di Rob Hyndman , ma lo statistico Brian Ripley ha consigliato in modo radicalmente diverso:

“Burnham and Anderson (2002) is a book I would recommend people NOT read until 
they have read the primary literature. I see no evidence that the authors have 
actually read Akaike’s papers." [quoted from [AIC MYTHS AND MISUNDERSTANDINGS][4] by
Burnham-Anderson]

Da ciò che Ripley scrive sull'AIC e sulla teoria correlata segue che l'avvertimento dovrebbe essere preso sul serio. Ho sia una buona collezione di articoli di Akaike che il libro di Burnham-Anderson. Alla fine avrò la mia opinione sulla qualità del libro, ma aiuterà anche a sapere cosa ne pensa la comunità di statistici, sia giovani che vecchi. In particolare, ci sono professori di statistica (o altri bravi studenti di statistica) che hanno esplicitamente raccomandato il libro come un utile sommario delle conoscenze sull'uso dell'AIC per la selezione dei modelli?

Riferimento:

(1) Burnham, KP & Anderson, selezione del modello DR e inferenza multimodel: un approccio teorico-informativo pratico Springer, 2002

PS. In risposta alla recente "risposta" affermando che "Dr.Burnham è uno statistico di dottorato" Vorrei aggiungere questo chiarimento. Sì, da solo è uno statistico, un membro dell'ASA e il destinatario di numerosi premi professionali, tra cui la Distinguished Achievement Medal dell'ASA. Ma chi dice che non lo è? Tutto quello che ho detto sopra è che come coppia di autori non sono statistici e il libro riflette questo fatto.


2
L'articolo "Miti e incomprensioni AIC" può essere trovato qui . Non l'avevo visto (anche se avevo già visto il commento di Ripley prima).
Glen_b -Restate Monica

3
La domanda fornisce collegamenti, ma penso che sarebbe utile per i lettori se la domanda stessa desse qualche suggerimento su cosa potrebbe essere negativo sul contenuto del libro di Burnham e Anderson. (Se ciò che dicono è accurato, chiaro, utile, ecc., Non importa se in realtà leggono gli articoli di Akaike.) Inoltre, mi sembra che l'AIC e i relativi metodi siano ancora controversi; in tal caso, qualsiasi libro che li presenta avrà detrattori. E un suggerimento che tutti devono leggere i documenti originali prima di leggere un libro che aspira a fornire un'introduzione a un argomento sembra discutibile.
Marte,

7
Ho letto i due documenti principali di Akaike, e quello di Schwarz sul BIC, e il libro di Burnham e Anderson (è sul mio scaffale in questo momento), e anche (come vedi), la breve critica di Ripley. Mi piacerebbe molto che Ripley spiegasse in dettaglio le critiche (senza le aspirazioni su chi potrebbe aver letto cosa) - allo stato attuale, non c'è davvero nulla di sostanziale a cui Burnham e Anderson possano rispondere. Se c'è qualcosa (e potrebbe esserci per quello che ne so), merita più di qualche riga su una mailing list di R-help.
Glen_b -Restate Monica

2
@Gleb_b Le opinioni di Ripley possono essere dedotte dal suo libro del 1996 sul riconoscimento dei modelli, a cui si riferiva in quel post dell'elenco R, vedere ad esempio il capitolo 2. I dettagli matematici e i commenti su altri aspetti del lavoro di Akaike (ad esempio cosa significa A in AIC per) fammi pensare che capisca bene quest'area e abbia letto più di alcuni articoli di Akaike.
letargo il

3
Inserendo due diversi centesimi: con che frequenza AIC e AICc danno consigli diversi? Nella mia esperienza suggeriscono gli stessi modelli.
Peter Flom - Ripristina Monica

Risposte:


3

Il PO sembra essere alla ricerca di un'indagine di alta qualità su statistici di alta qualità per aiutare a valutare se un libro in particolare è di alta qualità, in particolare per quanto riguarda il dibattito AIC contro AICc. Questo sito non è particolarmente orientato alle indagini sistematiche. Invece proverò ad affrontare direttamente la domanda sottostante.

L'AIC e l'AICc valutano entrambi i modelli in base a un compromesso euristico tra adattamento del modello (in termini di probabilità) e overfit (in termini di numero di parametri). In questo compromesso, l'AICc prevede una penalità leggermente maggiore sul numero di parametri. Pertanto, l'AICc raccomanda sempre a favore di modelli di complessità inferiore o uguale alla complessità del miglior modello AIC. In questo senso il rapporto tra i due è molto semplice, nonostante gli argomenti orribilmente complicati alla base delle loro derivazioni.

L'AIC e AICc sono solo due su un ampio campo di criteri di informazione dei candidati, con BIC e DIC che rappresentano forse le alternative principali. Il BIC è molto più conservativo (penalizzando un gran numero di parametri del modello) rispetto alla AIC o alla AICc nella maggior parte dei casi. La domanda su quale criterio sia il migliore è veramente specifica del problema. Si potrebbe legittimamente preferire un criterio estremamente conservativo nei casi in cui è necessaria una solida previsione fuori campione.

FWIW, ho trovato che il livello di conservatorismo dell'AICc era in genere preferibile all'AICc in ampi studi di simulazione sull'errore di predizione nei modelli di cattura-riconquista.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.