Criteri per la selezione del modello "migliore" in un modello Markov nascosto


12

Ho un set di dati di serie temporali in cui sto cercando di adattare un modello Hov (Hidden Markov Model) al fine di stimare il numero di stati latenti nei dati. Il mio pseudo codice per farlo è il seguente:

for( i in 2 : max_number_of_states ){ 
    ...
    calculate HMM with i states
    ...
    optimal_number_of_states = "model with smallest BIC"
    ...
}

Ora, nei soliti modelli di regressione, il BIC tende a favorire i modelli più parsimoniosi, ma nel caso dell'HMM non sono sicuro che sia quello che sta facendo. Qualcuno sa davvero a che tipo di HMM tende il criterio BIC? Sono anche in grado di ottenere l'AIC e il valore di probabilità. Dal momento che sto cercando di inferire il vero numero totale di stati, uno di questi criteri è "migliore" dell'altro per questo scopo?

Risposte:


11

Suppongo che la tua variabile di output sia categorica, anche se potrebbe non essere così. In genere, tuttavia, quando ho visto l'HMM utilizzato, il numero di stati è noto in anticipo anziché selezionato tramite la sintonizzazione. Di solito corrispondono a una variabile ben compresa che sembra non essere osservata. Ma ciò non significa che non puoi sperimentarlo.

Il pericolo nell'uso di BIC (e AIC) è che il valore k per il numero di parametri liberi nel modello aumenta quadraticamente con il numero di stati perché si ha la matrice di probabilità di transizione con parametri Px (P-1) (per stati P ) e le probabilità di uscita per ciascuna categoria di uscita in ciascun stato. Quindi, se AIC e BIC vengono calcolati correttamente, il k dovrebbe salire rapidamente.

Se disponi di dati sufficienti, consiglierei un metodo più morbido di regolazione del numero di stati come il test su un campione di controllo. Potresti anche voler solo guardare la statistica della probabilità e vedere visivamente a che punto i plateau. Inoltre, se i tuoi dati sono di grandi dimensioni, tieni presente che ciò spingerà il BIC a un modello più piccolo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.