Significato di "numero di parametri" in AIC


21

Quando si calcola AIC,

AIC=2k2lnL

k significa "numero di parametri". Ma cosa conta come parametro? Quindi ad esempio nel modello

y=ax+b

A e b sono sempre conteggiati come parametri? Cosa succede se non mi interessa il valore dell'intercetta, posso ignorarlo o conta ancora?

Cosa succede se

y=af(c,x)+b

dove f è una funzione di c e x, ora conto 3 parametri?


9
Questa è una buona domanda, perché esiste una sottigliezza: è il numero di parametri identificabili da stimare. Ad esempio, sebbene nel modello di regressione Y N ( β 0 + β 1 X 1 + β 2 X 2 + β 3 ( X 1 + X 2 ) , σ 2 ) sono scritti cinque parametri, tuttavia k = 4 . (Questo modello è equivalente a Y N (kYN(β0+β1X1+β2X2+β3(X1+X2),σ2) k=4 con α 1 = β 1 + β 3 e α 2 = β 2 + β 3 , che richiede esplicitamente solo quattro parametri.)YN(β0+α1X1+α2X2,σ2)α1=β1+β3α2=β2+β3
whuber

3
Rigorosamente, si contano tutti i parametri identificabili e liberi - parametri medi, parametri di forma e scala, qualunque cosa (e importa per AIC C ), ma per AIC non ha alcuna conseguenza se si omettono parametri comuni ai modelli da confrontare. Quindi, ad esempio, nella regressione, dovresti contare il parametro varianza. Quindi, secondo il mio conteggio, tutti i conteggi dei parametri nella tua domanda sono uno breve - ma se ce n'è esattamente uno in tutti i modelli, non fa male lasciarlo cadere per AIC. R conta esplicitamente il parametro varianza durante il calcolo dell'AIC nei modelli di regressione. C
Glen_b

@whuber Perché questo eccellente commento non è stato pubblicato come risposta? :)
Alexis,

Grazie @Alexis. Ho pubblicato questo pensiero come un commento perché l'idea è adeguatamente trattata nella risposta di P Schnell: volevo solo enfatizzarlo un po 'di più.
whuber

Risposte:


17

Come menzionato Mugen, rappresenta il numero di parametri stimati . In altre parole, è il numero di quantità aggiuntive che è necessario conoscere per specificare completamente il modello. Nel modello di regressione lineare semplice y = a x + b è possibile stimare a , b o entrambi. Qualunque quantità non stimata è necessario correggere. Non c'è "ignorare" un parametro nel senso che non lo conosci e non ti interessa. Il modello più comune che non stima sia a che b è il modello di non intercettazione, dove ripariamo b = 0k

y=ax+b
ababb=0. Questo avrà 1 parametro. Potresti altrettanto facilmente correggere o b = 1 se hai qualche motivo per credere che rifletta la realtà. (Punto preciso : σ è anche un parametro in una semplice regressione lineare, ma poiché è presente in ogni modello è possibile rilasciarlo senza influire sui confronti di AIC.)a=2b=1σ

Se il tuo modello è il numero di parametri dipende dal fatto che tu correggi uno di questi valori e dalla forma di f . Ad esempio, se vogliamo stimare a , b , c e sapere che f ( c , x ) = x c , quando scriviamo il modello abbiamo y = a x c + b con tre parametri sconosciuti. Se, tuttavia, f ( c ,

y=af(c,x)+b
fa,b,cf(c,x)=xc
y=axc+b
, quindi abbiamo il modello y = a c x + b che in realtà ha solo due parametri: a c e b .f(c,x)=cx
y=acx+b
acb

È fondamentale che sia una famiglia di funzioni indicizzata da c . Se tutto ciò che sai è che f ( c , x ) è continuo e dipende da c e x , allora sei sfortunato perché ci sono innumerevoli funzioni continue.f(c,x)cf(c,x)cx


2
(+1) Forse vale la pena ricordare che per "stima" si intende "stima per massima verosimiglianza".
Scortchi - Ripristina Monica

f(c,x)ccr2c

2
@SideshowBob: Sì - quando si confrontano due modelli, la differenza nelle probabilità di log massimizzate è uno stimatore distorto della differenza nella perdita prevista di informazioni di Kullback-Leibler e il termine di penalità in AIC corregge approssimativamente tale pregiudizio.
Scortchi - Ripristina Monica

1
@SideshowBob: dovrei menzionare che ci sono modifiche dell'AIC per equazioni di stima generalizzate e simili - usano la quasi-verosimiglianza massimizzata e un termine di penalità piuttosto più complesso.
Scortchi - Ripristina Monica

4

AIC=2k2ln(L)

(vedi qui )

k

k

Non mi sento abbastanza informato per rispondere alla tua seconda domanda, la lascerò per un altro membro della comunità.


1
λ

1
Sì certamente.
PA6OTA,

1

In primo luogo, per coloro che potrebbero non avere familiarità con AIC: l'Akaike Information Criterion (AIC) è una semplice metrica progettata per confrontare la "bontà" dei modelli.

Secondo AIC, quando si tenta di scegliere tra due diversi modelli che si applicano alle stesse variabili di input e risposta , ovvero modelli progettati per risolvere lo stesso problema, il modello con AIC inferiore viene considerato "migliore".

k

cf(c,x)k

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.