1. Stima del margine marginale e stimatore della media armonica
La probabilità marginale è definita come la costante normalizzante della distribuzione posteriore
p ( x ) = ∫Θp ( x | θ ) p ( θ ) dθ .
L'importanza di questa quantità deriva dal ruolo che svolge nel confronto tra modelli attraverso i fattori di Bayes .
Sono stati proposti diversi metodi per approssimare questa quantità. Raftery et al. (2007) propongono lo stimatore medio armonico , che divenne rapidamente popolare grazie alla sua semplicità. L'idea consiste nell'utilizzare la relazione
1p ( x )= ∫Θp ( θ | x )p ( x | θ )dθ .
Pertanto, se abbiamo un campione dal posteriore, diciamo , questa quantità può essere approssimata da( θ1, . . . , θN)
1p ( x )≈ 1NΣj = 1N1p ( x | θj).
Questa approssimazione è collegata al concetto di campionamento dell'importanza .
Secondo la legge dei grandi numeri, come discusso nel blog di Neal , abbiamo che questo stimatore è coerente . Il problema è che la richiesta per una buona approssimazione può essere enorme. Vedi il blog di Neal o il blog di Robert 1 , 2 , 3 , 4 per alcuni esempi.N
alternative
Esistono molte alternative per approssimare . Chopin e Robert (2008) presentano alcuni metodi basati sul campionamento Importance.p ( x )
2. Non eseguire il campionatore MCMC abbastanza a lungo (specialmente in presenza di multimodalità)
Mendoza e Gutierrez-Peña (1999) deducono il riferimento anteriore / posteriore per il rapporto di due mezzi normali e presentano un esempio delle inferenze ottenute con questo modello usando un set di dati reali. Usando i metodi MCMC, ottengono un campione di dimensione del posteriore del rapporto dei mezzi φ che è mostrato sotto2000φ
E ottenere l'intervallo HPD per ( 0.63 , 5.29 ) . Dopo un'analisi dell'espressione della distribuzione posteriore, è facile vedere che ha una singolarità a 0 e che la parte posteriore dovrebbe effettivamente apparire così (notare la singolarità a 0 )φ ( 0.63 , 5.29 )00
( 0 , 7,25 )
3. Altre questioni come la valutazione della convergenza, la scelta dei valori di partenza, il cattivo comportamento della catena possono essere trovate in questa discussione di Gelman, Carlin e Neal.
4. Campionamento dell'importanza
g
io= ∫f( x ) dx = ∫f( x )g( x )g( x ) dx .
g( x1, . . . , xN)io
io≈ 1NΣj = 1Nf( xj)g( xj).
gfN
# Integrating a Student's t with 1 d.f. using a normal importance function
x1 = rnorm(10000000) # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))
# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))