La domanda è di curiosità, cioè non sei soddisfatto della mia risposta qui ? Altrimenti...
L'ulteriore indagine su questa domanda delicata ha mostrato che esiste una regola empirica comunemente usata, secondo cui due modelli sono indistinguibili dal criterio se la differenza . Lo stesso che in realtà leggerai nell'articolo di Wikipedia su (nota che il link è cliccabile!). Solo per coloro che non fanno clic sui collegamenti:| A I C 1 - A I C 2 | < 2 A I CAIC|AIC1−AIC2|<2AIC
A I C A I CAIC stima il supporto relativo per un modello. Per applicare questo in pratica, iniziamo con una serie di modelli candidati, quindi troviamo i corrispondenti valori dei modelli . Quindi, identificare il valore minimo . La selezione di un modello può quindi essere effettuata come segue.AICAIC
Come regola empirica, i modelli che hanno il loro entro del minimo hanno un supporto sostanziale e dovrebbero essere presi in considerazione nel fare inferenze. I modelli che hanno il loro entro circa del minimo hanno un supporto notevolmente inferiore, mentre i modelli con il loro sopra del minimo non hanno sostanzialmente alcun supporto e potrebbero essere omessi da ulteriori considerazioni o almeno non riescono a spiegare alcune sostanziali variazioni strutturali in i dati.AIC1–2AIC4–7AIC>10
Un approccio più generale è il seguente ...
Indichiamo i valori dei modelli candidati da , . Let indica il minimo di questi valori. Quindi può essere interpretato come la probabilità relativa che l' -esimo modello minimizzi la perdita di informazioni (prevista stimata).AICAIC1AIC2,AIC3,…,AICRAICmine(AICmin−AICi)/2i
Ad esempio, supponiamo che ci fossero tre modelli nel set candidato, con valori , e . Quindi il secondo modello è volte più probabile del primo modello per ridurre al minimo la perdita di informazioni, e il terzo modello è volte probabile come il primo modello per ridurre al minimo la perdita di informazioni. In questo caso, potremmo omettere il terzo modello da ulteriori considerazioni e prendere una media ponderata dei primi due modelli, con pesi e , rispettivamente. L'inferenza statistica si baserebbe quindi sul modello multiplo ponderato.AIC100102110e(100−102)/2=0.368e(100−110)/2=0.00710.368
Bella spiegazione e suggerimenti utili, secondo me. Non aver paura di leggere ciò che è cliccabile!
In aggiunta , una volta nota, è meno preferibile per insiemi di dati di grandi dimensioni. Oltre a potresti trovare utile applicare la versione corretta del bias del criterio (puoi usare questo codice o usare la formula , dove è il numero di parametri stimati). La regola empirica sarà la stessa però. AICBICAICAICcR
AICc=AIC+2p(p+1)n−p−1p