Interpretazione del valore AIC


9

I valori tipici di AIC che ho visto per i modelli logistici sono in migliaia, almeno in centinaia. ad es. su http://www.r-bloggers.com/how-to-perform-a-logistic-regression-in-r/ l'AIC è 727.39

Mentre si dice sempre che l'AIC dovrebbe essere usato solo per confrontare i modelli, ho voluto capire cosa significa un determinato valore AIC. Secondo la formula, AIC=2log(L)+2K

Dove, L = massima probabilità dallo stimatore MLE, K è il numero di parametri

Nell'esempio sopra, K = 8

quindi, con un semplice calcolo aritmico:

727.9 = -2*log(L)+ 2*8
Hence, 711.39 = -2*log(L)
Hence, log (L)= 711.39/-2 = -355.695
Hence, L = exp(-355.695) = 3.3391E-155

Quindi, se la mia comprensione è corretta, questa è la probabilità della funzione identificata da MLE che si adatta ai dati. Questo sembra davvero davvero molto basso.

Cosa mi sto perdendo qui?


pmf(observed data;parameter estimates)

Scusate, siamo stati tagliati, se lo guardiamo in quel modo, allora questo suggerisce che con il gran numero di record ottenere esattamente i dati osservati non era così probabile per le stime dei parametri.
Björn,

Risposte:


9

Non esiste una probabilità "tipica" o corretta per un modello. Lo stesso con AIC , che è la probabilità di log negativa penalizzata per un numero di parametri. Un valore inferiore di AIC suggerisce un modello "migliore", ma è una misura relativa dell'adattamento del modello. Viene utilizzato per la selezione del modello, ovvero consente di confrontare diversi modelli stimati nello stesso set di dati.

Ricorda GEP Box dicendo che "tutti i modelli sono sbagliati, ma alcuni sono utili", non sei interessato a trovare un modello che si adatti perfettamente ai tuoi dati perché è impossibile e tale modello in molti casi sarebbe molto scarso, sovradimensionato . Invece, stai cercando il migliore che puoi ottenere, il più utile. L'idea generale dietro AIC è che il modello con un numero inferiore di parametri è migliore, ciò che è in qualche modo coerente con l' argomento del rasoio di Occam , che preferiamo un modello semplice a uno complicato.

Puoi controllare i seguenti documenti:

Anderson, D., e Burnham, K. (2006). Miti e incomprensioni dell'AIC.

Burnham, KP e Anderson, DR (2004). Inferenza multimodello. Comprensione di AIC e BIC nella selezione dei modelli. Sociological Methods & Research, 33 (2), 261-304.

e quei thread:

Qual è la differenza tra "verosimiglianza" e "probabilità"?

C'è qualche motivo per preferire l'AIC o il BIC rispetto all'altro?



3

R2χ2χ22×R21exp(χ2/n)R2R2


1

Questo sembra davvero davvero molto basso. Cosa mi sto perdendo qui?

Quantitativi come l'AIC, che comportano l'uso della verosimiglianza, sono significativi solo rispetto ad altri quantitativi del genere . Ricorda che la funzione di probabilità è definita solo fino a una costante di ridimensionamento, quindi può essere ingrandita o ridotta a piacimento. Di conseguenza, la probabilità di log è definita solo fino a una costante di posizione e può essere spostata verso l'alto o verso il basso a piacimento. Ciò vale anche per l'AIC, poiché questa quantità è solo la probabilità logaritmica, spostata di una penalità sul numero di parametri. Questo è il motivo per cui si dice che l'AIC dovrebbe essere usato solo per confrontare i modelli.

n=800

^=(727.92×8)/(2)=355.95.

^/n=0.44493750.6408643


0

Hai giustamente sottolineato che se si calcola indietro la probabilità, utilizzando l'AIC riportato da R, si ottengono probabilità ridicolmente basse. Il motivo è che il valore di AIC riportato da R (chiamalo AICrep) non è il vero AIC (AICtrue). AICrep e AICtrue differiscono per una costante che dipende dai dati misurati ma che è indipendente dal modello scelto. Pertanto una probabilità ricalcolata da AICrep sarà errata. Sono le differenze negli AIC, quando vengono utilizzati modelli diversi per adattarsi agli stessi dati, che sono utili nella selezione del modello migliore.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.