Estrarre campioni da una miscela finita di distribuzioni normali?


10

Dopo alcuni passaggi di aggiornamento bayesiano, mi rimane una distribuzione posteriore della forma di una miscela di distribuzioni normali,Vale a dire, il parametro è tratto da una distribuzione il cui PDF è dato come una miscela ponderata di PDF normali e non è una somma di camper normali. Vorrei disegnare campioni \ theta \ sim \ Pr (\ theta | \ text {data}) da usare in un'importante approssimazione campionaria di questo posteriore. In pratica, la somma sopra i può avere un gran numero di termini, quindi può essere poco pratico scegliere un termine i secondo i pesi \ {w_i \} e quindi disegnare \ theta \ sim N (\ mu_i, \ sigma ^ 2)θ θ ~ Pr ( θ | dati ) i i { w i } θ ~ N ( μ i , σ 2 )

Pr(θ|data)=i=1kwiN(μi,σ2).
θθPr(θ|data)ioio{wio}θ~N(μio,σ2). Esiste un modo efficiente per estrarre campioni da un posteriore di questa forma?

Hai effettivamente provato il metodo select then throw? La selezione può essere effettuata ragionevolmente velocemente di O (k) passi.
dmckee --- ex gattino moderatore

1
Se la soluzione di Barron non è davvero corretta e in realtà intendi un "modello di miscela", potresti usare questo termine?
Neil G,

1
Neil G: Non sono uno statistico di professione, piuttosto un fisico che a volte ha bisogno di usare le statistiche. In quanto tale, non conoscevo il termine appropriato per descrivere ciò di cui avevo bisogno. Ora posso continuare e modificare la domanda per chiarire che i PDF vengono sommati e non i camper.
Chris Granade,

1
@ChrisGranade: non stavo cercando di venire su di te. Volevo solo assicurarmi che fosse quello che volevi dire e suggerire la modifica.
Neil G,

1
Perché non è pratico scegliere base ai pesi e ad un campione dalla distribuzione uniforme su , quindi al campione ? Questo è solo moderatamente più costoso del campionamento di una singola distribuzione normale, il costo è indipendente dal numero di distribuzioni miste e non si basa sul fatto che tali distribuzioni siano normali. { w i } [ 0 , 1 ] N ( μ i , σ 2 ) kio{wio}[0,1]N(μio,σ2)K
Jed Brown,

Risposte:


6

In linea di principio, è possibile preselezionare il numero di campioni da prelevare da ciascuna sottodistribuzione, quindi visitare ogni sottodistribuzione una sola volta e disegnare il numero di punti.

Questo è

  1. Trova l'insieme casuale tale che e rispettando i pesi.n = k i = 1 n i<n1,n2,...,nK>n=Σio=1Knio

    Credo che tu faccia questo disegnando una distribuzione di Poisson una distribuzione multinomiale (vedi i commenti) della media per ogni sub-distribuzione e quindi normalizzando la somma a .nwio*nn

    Il lavoro qui èO(K)*O(n)

  2. Quindi fa

    for (i=1; i<=k; ++i)
       for (j=1; j<=n[i]; ++j)
          theta ~ N(mu[i],sigma[i])
    

    Il lavoro qui èO(n)

Anche se questo significa che non ottieni l'ordine casuale. Se è richiesto un ordine casuale, devi quindi mescolare i sorteggi (anche big ).O(n)

Sembra che il primo passo sia dominato in fase di esecuzione e dello stesso ordine dell'algoritmo ingenuo, ma se sei sicuro che tutti potresti approssimare le distribuzioni di Poisson con distribuzioni normali e accelerare il primo passo.wio*n»1


La distribuzione di non è una distribuzione di Poisson se è fissa, ma una distribuzione binomiale. nnin
Frédéric Grosshans,

@ FrédéricGrosshans Uhm ... ecco dove ammetto la mia angosciante debolezza nella probabilità. Guardando penso che tu possa avere ragione. Non ho un link per lanciare distribuzioni binomiali arbitrarie, ma Wikipedia ha alcuni riferimenti . Esiste anche una relazione tra Poisson e Binomial, che ho intenzione di dichiarare responsabile della mia incertezza. Sì, quello è il biglietto.
dmckee --- ex gattino moderatore

1
@dmckee: buona risposta per trarre da un modello di miscela, tranne per il fatto che dovrebbe essere una distribuzione multinomiale piuttosto che una distribuzione di Poisson nel passaggio 1.
Neil G

3

Nota: la versione originale di questa domanda chiedeva una "somma ponderata delle distribuzioni normali" a cui potrebbe essere utile la seguente risposta. Tuttavia, dopo un bel po 'di discussione su questa risposta, la risposta di @Geoff e sulla domanda stessa, è diventato chiaro che la domanda era davvero sul campionamento di una "miscela di distribuzioni normali" a cui questa risposta non è applicabile.


La somma delle distribuzioni normali è una distribuzione normale, quindi è possibile calcolare i parametri di questa singola distribuzione e quindi semplicemente trarne dei campioni. Se chiamiamo quella distribuzione , allora,N(μSum,σSum2)

μSum=Σio=1Kwioμio

σSum2=Σio=1Kwio2σio2

3
Per dirla in breve, Chris sta sommando le funzioni di densità di probabilità, non variabili casuali.
Geoff Oxberry,

2
Chris vuole un PDF che contenga (almeno in linea di principio) più dossi. Cioè, era la somma dei PDF, non il PDF di una somma.
dmckee --- ex gattino moderatore

1
È vero che la somma delle variabili casuali normalmente distribuite è essa stessa una variabile casuale normalmente distribuita. Tuttavia, la somma delle distribuzioni normali non è una distribuzione normale. Quindi se e X 2N ( μ 2 , σ 2 2 ) , è vero che X 1 + X 2N ( μ 1 + μ 2 , σ 2 1X1~N(μ1,σ12)X2~N(μ2,σ22) , ma P D F ( X 1 + X 2 ) P D F ( X 1 ) + P D F ( X 2 ) . (Il merito va a @ChrisGranade per la spiegazione.)X1+X2~N(μ1+μ2,σ12+σ22)PDF(X1+X2)PDF(X1)+PDF(X2)
Geoff Oxberry,

2
@dmckee: questa non è una "somma ponderata delle distribuzioni normali", è una "miscela di distribuzioni normali".
Neil G,

2
I commenti di @Barron non sono considerati una parte essenziale della pagina. Dovresti assolutamente modificare la tua risposta per includere l'essenza dei commenti in modo che i lettori che non guardano i commenti non vengano fuorviati.
David Ketcheson,

2

Aggiornamento : questa risposta è errata, derivante dalla confusione nella terminologia (vedere la catena di commenti qui sotto per i dettagli); Lo sto solo lasciando come una guida in modo che le persone non ripubblicano questa risposta (oltre a Barron). Si prega di non votare su o giù.

X1~N(μ1,σ12)X2~N(μ2,σ22)

X1+X2~N(μ1+μ2,σ12+σ22).

w1R

w1X1~N(w1μ1,w12σ12).

Usando questi due risultati combinati, quindi

Pr(θ|dun'tun')~N(Σio=1Kwioμio,Σio=1Kwio2σio2).

Quindi, in questo caso, dovrai solo estrarre campioni da una singola distribuzione, che dovrebbe essere molto più tracciabile.


2
Questa è la soluzione a un diverso problema che può essere visto dal fatto che la distribuzione originale è multimodale e il tuo suggerimento è monomodale.
Chris Ferrie,

@ChrisFerrie: ti credo, ma sulla base della notazione, sono confuso sul perché la distribuzione sopra sarebbe multimodale, mentre la somma di due variabili casuali gaussiane indipendenti non lo sarebbe. Cosa mi sto perdendo qui?
Geoff Oxberry,

p(X1+X2)p(X1)+p(X2)io

Ah, stai guardando somme di PDF. Sì, quella è una bestia completamente diversa. Ora che ho letto la domanda più da vicino, vedo quello che stai dicendo e cancellerò la mia risposta. Grazie!
Geoff Oxberry,

Ho cancellato la mia risposta precedentemente cancellata solo per fungere da guida per gli altri in modo che nessun altro risponda a questa domanda come Barron e io. Ti preghiamo di non votare più o meno la mia risposta.
Geoff Oxberry,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.