Mettere un precedente sul parametro di concentrazione in un processo di Dirichlet


9

La maggior parte di questi è sfondo, salta alla fine se conosci già abbastanza le miscele di processo di Dirichlet . Supponiamo che stia modellando alcuni dati come provenienti da una combinazione di processi di Dirichlet, ovvero che e subordinato a assumanoFD(αH)F

Yiiidf(y|θ)F(dθ).

Qui e è la misura di base precedente. Si scopre che se per ogni osservazione , se conosco il latente associato , la probabilità di in questo modello è dove è il numero di valori distinti di (la misura casuale è discreta quasi sicuramente). Escobar e West sviluppano il seguente schema per campionare usando un precedente Gamma; prima scrivonoα>0αHYiθiα

L(α|t)αtΓ(α)Γ(α+n)
tθiFα
π(α|t)π(α)αtΓ(α)Γ(α+n)π(α)αt1(α+n)B(α+1,n)=π(α)αt1(α+n)01xα(1x)n1 dx,
dove è la funzione beta. Quindi nota che se introduciamo un parametro latente allora la probabilità ha la forma di una miscela di distribuzioni gamma e usiamo questo per scrivere un campionatore di Gibbs.B(,)XBeta(α+1,n)

Ora la mia domanda. Perché non possiamo semplicemente scrivere e invece di usare una combinazione di distribuzioni Gamma usi una singola distribuzione Gamma? Se introduciamo non dovrei essere in grado di fare la stessa cosa ma senza dover usare la miscela?

L(α|t)αtΓ(α)Γ(α+n)=αtΓ(n)Γ(α)Γ(α+n)Γ(n)=αtB(α,n)Γ(n)αt01xα1(1x)n1 dx,
XBeta(α,n)

Modifica per maggiori dettagli Ulteriori dettagli: Per colmare alcune lacune, l'argomento in Escobar e West è che, lasciando che abbia una distribuzione Gamma con forma e significhi , e così possiamo introdurre una latente in modo cheI condizionali completi sono una distribuzione per e una miscela di a e aαaa/b

π(α|t)αa+t2(α+n)ebα01xα(1x)n1 dx
X
π(α,x|t)αa+t2(α+n)ebαxα(1x)n1.
Beta(α+1,n)XG(a+t,blog(x))G(a+t1,blog(x)) per .α

Per lo stesso argomento, ho ottenuto lo stesso risultato ma con per e per . Questo mi sembra più facile; perché non lo fanno e basta?Beta(α,n)XG(a+t,blog(x))α

Risposte:


3

Non vedo come ciò che hai scritto sia fondamentalmente diverso da Escobar e West.

π(α|t)π(α)π(t|α)=π(α)L(α|t)π(α)αtΓ(α)Γ(α+n)π(α)αtΓ(α)Γ(n)Γ(α+n)=π(α)αtB(α,n)=π(α)αt1(α+n)B(α+1,n)
dove la penultima riga è come la hai e l'ultima riga è come E&W hanno e sono uguali poiché n) \ end {eqnarray *} ricordandolo
αB(α,n)=αΓ(α)Γ(n)Γ(α+n)=(αΓ(α))Γ(n)(α+n)(Γ(α+n)(α+n))=(α+n)Γ(α+1)Γ(n)Γ(α+n+1)=(α+n)B(α+1,n)
Γ(z+1)=zΓ(z) .

Immagino che abbiano preferito la loro formulazione alla tua perché ha solo il termine della funzione Beta, non il prodotto di una Beta e di una gamma, ma potrei sbagliarmi. Non ho seguito del tutto l'ultimo bit che hai scritto, potresti essere più esplicito sul tuo schema di campionamento?


Aggiunti ulteriori dettagli nel mio post.
ragazzo
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.