La formula che citi dalle tue note non è esattamente AIC.
AIC è .−2logL+2k
Qui darò uno schema di una derivazione approssimativa che chiarisce abbastanza cosa sta succedendo.
Se hai un modello con errori normali indipendenti con varianza costante,
L∝σ−ne−12σ2∑ε2i
che può essere stimato con la massima probabilità come
∝∝∝(σ^2)−n/2e−12nσ^2/σ^2(σ^2)−n/2e−12n(σ^2)−n/2
(supponendo che la stima di sia la stima ML)σ2
Quindi (fino allo spostamento di una costante)−2logL+2k=nlogσ^2+2k
Ora nel modello ARMA, se è davvero grande rispetto a e , allora la probabilità può essere approssimata da un tale quadro gaussiano (ad esempio puoi scrivere l'ARMA approssimativamente come un AR più lungo e condizionare a condizioni sufficienti per scrivere quell'AR come modello di regressione), quindi con al posto di :TpqTn
AIC≈Tlogσ^2+2k
quindi
AIC/T≈logσ^2+2k/T
Ora, se stai semplicemente confrontando AIC, quella divisione per non ha alcuna importanza, dal momento che non cambia l'ordine dei valori AIC.T
Tuttavia, se stai usando AIC per qualche altro scopo che si basa sul valore effettivo delle differenze in AIC (come fare l'inferenza multimodel come descritto da Burnham e Anderson), allora è importante.
Numerosi testi di econometria sembrano utilizzare questo modulo AIC / T. Stranamente, alcuni libri sembrano fare riferimento a Hurvich e Tsai 1989 o Findley 1985 per quel modulo, ma Hurvich & Tsai e Findley sembrano discutere della forma originale (anche se ho solo un'indicazione indiretta di ciò che Findley fa in questo momento, quindi forse c'è qualcosa in Findley su di esso).
Tale ridimensionamento potrebbe essere fatto per una serie di ragioni - ad esempio, le serie temporali, in particolare le serie temporali ad alta frequenza, possono essere molto lunghe e gli AIC ordinari potrebbero avere la tendenza a diventare ingombranti, specialmente se è molto piccolo. (Ci sono alcune altre possibili ragioni, ma dal momento che davvero non conosco la ragione per cui ciò è stato fatto, non inizierò a scendere un elenco di tutte le possibili ragioni.)σ2
Potresti dare un'occhiata all'elenco di fatti e fallimenti dell'AIC di Rob Hyndman , in particolare i punti da 3 a 7. Alcuni di questi punti potrebbero portarti ad essere almeno un po 'cauto nel fare troppo affidamento sull'approssimazione della probabilità gaussiana, ma forse c'è una giustificazione migliore di quella che offro qui.
Non sono sicuro che ci sia una buona ragione per usare questa approssimazione alla probabilità logaritmica piuttosto che all'AIC reale poiché molti pacchetti di serie temporali oggigiorno tendono a calcolare (/ massimizzare) la verosimiglianza effettiva per i modelli ARMA. Sembra che ci siano poche ragioni per non usarlo.