Aggiornamento di un fattore Bayes


9

Un fattore di Bayes è definito nel test bayesiano dell'ipotesi e nella selezione del modello bayesiano dal rapporto di due probabilità marginali: dato un campione iid e le rispettive densità di campionamento e , con corrispondenti priori e , il fattore Bayes per confrontare i due modelli è Un libro che sto recensendo ha la strana affermazione che il suddetto fattore di Bayes(x1,,xn)f1(x|θ)f2(x|η)π1π2

B12(x1,,xn)=defm1(x1,,xn)m2(x1,,xn)=defi=1nf1(xi|θ)π1(dθ)i=1nf2(xi|η)π2(dη)
B12(x1,,xn) è "formato moltiplicando insieme i singoli [fattori di Bayes]" (p.118). Ciò è formalmente corretto se si utilizza la decomposizione ma non vedo un vantaggio computazionale in questa scomposizione come aggiornamento di richiede lo stesso sforzo computazionale del calcolo originale di
B12(x1,,xn)=m1(x1,,xn)m2(x1,,xn)=m1(xn|x1,,xn1)m2(xn|x1,,xn1)×m1(xn1|xn2,,x1)m2(xn1|xn2,,x1)××m1(x1)m2(x1)
m1(xn|x1,,xn1)m2(xn|x1,,xn1)
m1(x1,,xn)m2(x1,,xn)
fuori esempi di giocattoli artificiali.

Domanda: esiste un modo generico e computazionalmente efficiente di aggiornare il fattore Bayes da a \ mathfrak {B} _ {12} (x_1, \ ldots, x_ {n + 1}) che non richiede il ricalcolo dell'intero margine m_1 (x_1, \ ldots, x_n) e m_2 (x_1, \ ldots, x_n) ?B12(x1,,xn)B12(x1,,xn+1)m1(x1,,xn)m2(X1,...,Xn)

La mia intuizione è che, oltre ai filtri antiparticolato, che in effetti procedono nella stima dei fattori di Bayes B12(X1,...,Xn) una nuova osservazione alla volta, non esiste un modo naturale di rispondere a questa domanda .


1
Non mi sembra chiaro che la formulazione implichi necessariamente una fattorizzazione sequenziale , dal momento che le osservazioni sono escluse. Durante la scuola elementare, un professore ha affermato che il prodotto implica che si potrebbero usare approssimazioni asintotiche per le analisi bayesiane ma stranamente questo non ha preso piede (sarcasmo). Forse il libro potrebbe suggerirlo?
Cliff AB,

@CliffAB: Sì, potresti riscrivere la probabilità come media di singoli termini, convergendo a una distanza di Kullback-Leibler dalla vera distribuzione. Ma non penso che sia così, anche se il libro non è abbastanza chiaro da tenere aperte tutte le opzioni.
Xi'an,

1
Credo che ci sia un refuso nella seconda equazione visualizzata: dovrebbe essere nel secondo fattore sulla seconda riga? m1(Xn-1|Xn-1,...,X1)
jochen

Risposte:


4

Presumibilmente lo scopo di un'equazione ricorsiva per il fattore Bayes sarebbe quando hai già calcolato il fattore Bayes per punti dati e vuoi essere in grado di aggiornarlo con un punto dati aggiuntivo. Sembra che sia possibile farlo senza ricalcolare i margini del vettore di dati precedente, purché sia nota la forma della funzione posteriore . Supponendo che conosciamo la forma di questa funzione (e assumendo i dati IID come nella tua domanda), la densità predittiva può essere scritta come:nπn

m(Xn+1|X1,...,Xn)=Θf(Xn+1|θ)πn(dθ|X1,...,Xn).

Quindi, hai:

m(X1,...,Xn+1)=m(X1,...,Xn)Θf(Xn+1|θ)πn(dθ|X1,...,Xn).

Confrontando due classi di modelli tramite il fattore Bayes, otteniamo quindi l'equazione ricorsiva:

B12(X1,...,Xn+1)=B12(X1,...,Xn)Θ1f(Xn+1|θ)π1,n(dθ|X1,...,Xn)Θ2f(Xn+1|θ)π2,n(dθ|X1,...,Xn).

Ciò implica ancora l'integrazione nell'intervallo di parametri, quindi sono d'accordo con la tua opinione sul fatto che non sembra esserci alcun vantaggio computazionale rispetto al solo ricalcolare il fattore Bayes tramite la formula iniziale che dai. Tuttavia, è possibile notare che ciò non richiede di ricalcolare i margini per il vettore di dati precedente. (Invece calcoliamo le densità predittive del nuovo punto dati in base ai dati precedenti, sotto ciascuna delle classi del modello.) Come te, non vedo davvero alcun vantaggio computazionale di questo, a meno che non accada che questa formula integrale si semplifichi facilmente. In ogni caso, suppongo che ti dia un'altra formula per aggiornare il fattore Bayes.


Grazie. È vero che non è necessario ricalcolare i margini, rigorosamente sensu , ma la quantità di calcolo sembra essere la stessa, come si nota.
Xi'an,

L'unico vantaggio che mi viene in mente è che dato che ora ci stiamo integrando solo su una singola densità (piuttosto che il prodotto di densità), l'integrando sarà meno volatile, e quindi quest'ultima formula potrebbe rendere più facile evitare problemi di underflow in calcolo. Questo è forse un grosso problema. n
Ben - Ripristina Monica l'
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.