Algoritmo EM Problema pratico


9

Questo è un problema pratico per un esame di medio termine. Il problema è un esempio di algoritmo EM. Sto riscontrando problemi con la parte (f). Elenco le parti (a) - (e) per il completamento e nel caso in cui ho commesso un errore in precedenza.

Consenti a essere variabili casuali esponenziali indipendenti con rate . Sfortunatamente, i valori effettivi non vengono osservati e osserviamo solo se i valori rientrano in determinati intervalli. Lascia che , e per . I dati osservati sono costituiti da .X1,,XnθXXG1j=1{Xj<1}G2j=1{1<Xj<2}G3j=1{Xj>2}j=1,,n(G1j,G2j,G3j)

(a) Fornire la probabilità dei dati osservati:

L(θ|G)=j=1nPr{Xj<1}G1jPr{1<Xj<2}G2jPr{Xj>2}G3j=j=1n(1eθ)G1j(eθe2θ)G2j(e2θ)G3j

(b) Fornire la completa verosimiglianza dei dati

L(θ|X,G)=j=1n(θeθxj)G1j(θeθxj)G2j(θeθxj)G3j

(c) Deriva la densità predittiva della variabile latente f(xj|G,θ)

f(xj|G,θ)=fX,G(xj,g)fG(g)=θeθxj1{xjregion r s.t. Grj=1}(1eθ)g1j(eθe2θ)g2j(e2θ)g3j

(d) E-step. Dare la funzioneQ(θ,θi)

Q(θ,θi)=EX|G,θi[logf(x|G,θ)]=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθe2θ)N3loge2θ=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)N2log(eθ(1eθ))+2θN3=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3

doveN1=j=1ng1j,N2=j=1ng2j,N3=j=1ng3j

(e) Fornisci espressioni per per . r = 1 , 2 , 3E[Xj|Grj=1,θi]r=1,2,3

Elencherò i miei risultati, che sono abbastanza sicuro, ma le derivazioni sarebbero un po 'lunghe per questa domanda già troppo lunga:

E[Xj|G1j=1,θi]=(11eθi)(1θieθi(1+1/θi))E[Xj|G2j=1,θi]=(1eθie2θi)(eθi(1+1/θi)e2θi(2+1/θi))E[Xj|G3j=1,θi]=(1e2θi)(e2θi(2+1/θi))

Questa è la parte su cui sono bloccato e potrebbe essere a causa di un errore precedente:

(f) M-Step. Trova il che massimizzaQ ( θ , θ i )θQ(θ,θi)

Dalla legge dell'aspettativa totale abbiamo PertantoE[Xj|G,θi]=(1θieθi(1+1/θi))+(eθi(1+1/θi)e2θi(2+1/θi))+(e2θi(2+1/θi))=1/θi

Q(θ,θi)=nlogθθj=1nE[Xj|G,θi]N1log(1eθ)+θN2N2log(1eθ)+2θN3=nlogθθnθiN1log(1eθ)+θN2N2log(1eθ)+2θN3Q(θ,θi)θ=nθnθi(N1+N2)eθ1eθ+N2+2N3

Quindi dovrei impostare questo uguale a zero e risolvere per , ma l'ho provato per molto tempo e non riesco a risolvere per !θθθ


Ho interpretato come un potere di per un minuto. Molto confuso. Di solito il numero di iterazione (numero di passaggio) viene inserito tra parentesi o tra parentesi modo che non sia confuso con l' -esima potenza . Probabilmente è meglio dire almeno che è quello che è nella domanda (supponendo che ora abbia ragione). θ [ i ] ( i ) θ ( i ) i θ iθiθ[i](i)θ(i)iθi
Glen_b -Restate Monica

1
Sì Glen, mi dispiace, è davvero il ° iterate dell'algoritmo EM. i
bdeonovic,

Risposte:


5

La completa verosimiglianza dei dati non dovrebbe coinvolgere G! Dovrebbe semplicemente essere la probabilità di quando le sono esponenziali. Si noti che la completa verosimiglianza dei dati così come è stata scritta semplifica in una verosimiglianza esponenziale poiché solo una delle può essere 1. Lasciando le nella verosimiglianza completa dei dati, tuttavia, si incasina in seguito. X G r j GθXGrjG

Nella parte (d) dovrebbe essere prevista l'aspettativa della verosimiglianza completa del registro dati, non della verosimiglianza osservata del registro dati.

Inoltre, non dovresti usare la legge delle aspettative totali! Ricorda che G è osservato e non è casuale, quindi dovresti eseguire solo una di quelle aspettative condizionali per ogni . Sostituisci semplicemente questa aspettativa condizionale con il termine e quindi esegui il passaggio M.X ( i ) jXjXj(i)


@Benjamin Come va il problema? Sono stato in grado di aiutarti a capire come farlo?
jsk,

Grazie per i commenti @jsk. Ero stanco ieri sera, quindi sono andato a letto, ma lo farò di nuovo stamattina dopo colazione :)
bdeonovic,

Penso di averlo capito! Grazie ancora! Questo era in realtà in preparazione per una finale che ho oggi, quindi mi ha davvero aiutato a chiarire alcune cose sull'EM.
bdeonovic,

Prego. Spero che la tua finale vada bene oggi!
jsk,

4

Sulla base dei commenti di @ jsk, cercherò di porre rimedio ai miei errori:

L(θ|X,sol)=Πj=1nθe-θXj

Q(θ,θio)=nlogθ-θΣj=1nE[Xj|sol,θio]=nlogθ-θ(Σj=1ng1j1-e-θio)(1θio-e-θio(1+1/θio))-θ(Σj=1ng2je-θio(1-e-θio))(e-θio(1+1/θio)-e-2θio(2+1/θio))-θ(Σj=1ng3je-2θio)(e-2θio(2+1/θio))=nlogθ-θN1UN-θN2B-θN3CQ(θ,θio)θ=nθ-N1UN-N2B-N3C=Set0

risolvendo per otteniamoθθ(io+1)=nN1UN+N2B+N3C

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.