L'algoritmo EM stima costantemente i parametri nel modello di miscela gaussiana?


9

Sto studiando il modello di miscela gaussiana e mi pongo questa domanda da solo.

Supponiamo che i dati sottostanti siano generati da una miscela di distribuzione gaussiana di e ciascuno di essi abbia un vettore medio , dove e ciascuno di essi ha lo stesso co- matrice di varianza e supponiamo che questo sia una matrice diagonale. E supponiamo che il rapporto di miscelazione sia , cioè che ogni cluster abbia lo stesso peso.μ kR p 1 k K Σ Σ 1 / KKμkRp1kKΣΣ1/K

Quindi, in questo esempio ideale, l'unico lavoro è stimare i vettori della media , dove e la matrice di co-varianza .μ kR p 1 k K ΣKμkRp1kKΣ

La mia domanda è: se utilizziamo l'algoritmo EM, saremo in grado di stimare costantemente e , ovvero, quando la dimensione del campione , lo stimatore prodotto dall'algoritmo EM raggiungerà il valore reale di e ? Σ n μ k ΣμkΣnμkΣ

Risposte:


1

Se l'algoritmo viene inizializzato con valori casuali ogni volta, allora no, la convergenza non sarà necessariamente coerente. L'inizializzazione non casuale produrrà presumibilmente lo stesso risultato ogni volta, ma non credo che ciò debba necessariamente produrre i valori "corretti" di .μk

Inoltre, fissando il rapporto di miscelazione su e fissando diagonale su , l'algoritmo diventa molto simile all'algoritmo -means. Ciò ha anche una convergenza incoerente, a seconda dell'inizializzazione casuale.Σ k1/KΣk


Ho sperimentato numericamente, almeno per 2 classi indipendenti di distribuzione normale, l'EM produce stimatore coerente della media di classe. Tuttavia, K significa che non può farlo, l'ho dimostrato matematicamente
KevinKim,

1
Potresti fornire maggiori dettagli per favore? Ad esempio quali dati stavi utilizzando, come hai inizializzato i parametri ecc.
dcorney,

Concordo con @dcorney. Dipende davvero dai valori iniziali che sceglierai. Almeno in pratica la scelta errata dei valori iniziali porta a una stima incoerente (utilizzo il pacchetto Mixtools R)
Tedesco Demidov
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.