La proporzionalità viene utilizzata per semplificare l'analisi
L'analisi bayesiana viene generalmente effettuata tramite una dichiarazione ancora più semplice del teorema di Bayes, in cui lavoriamo solo in termini di proporzionalità rispetto al parametro di interesse. Per un modello IID standard con densità di campionamento possiamo esprimerlo come:f(X|θ)
p(θ|x)∝Lx(θ)⋅p(θ)Lx(θ)∝∏i=1nf(xi|θ).
Questa affermazione di aggiornamento bayesiano funziona in termini di proporzionalità rispetto al parametro . Utilizza due semplificazioni della proporzionalità: una nell'uso della funzione di verosimiglianza (proporzionale alla densità di campionamento) e una nella parte posteriore (proporzionale al prodotto di verosimiglianza e precedente). Poiché il posteriore è una funzione di densità (nel caso continuo), la regola di normazione imposta quindi la costante moltiplicativa necessaria per produrre una densità valida (cioè per integrarla in una).θ
Questo metodo di utilizzo della proporzionalità ha il vantaggio di permetterci di ignorare qualsiasi elemento moltiplicativo delle funzioni che non dipende dal parametro . Questo tende a semplificare il problema permettendoci di spazzare via parti inutili della matematica e ottenere dichiarazioni più semplici del meccanismo di aggiornamento. Questo non è un requisito matematico (dal momento che la regola di Bayes funziona anche nella sua forma non proporzionale), ma semplifica le cose per i nostri cervelli di piccoli animali.θ
Un esempio applicato: considera un modello IID con i dati osservati . Per facilitare la nostra analisi definiamo le statistiche e , che sono i primi due momenti di esempio. Per questo modello abbiamo densità di campionamento:X1,...,Xn∼IID N(θ,1)x¯=1n∑ni=1xix¯¯=1n∑ni=1x2i
f(x|θ)=∏i=1nf(xi|θ)=∏i=1nN(xi|θ,1)=∏i=1n12π−−√exp(−12(xi−θ)2)=(2π)n/2exp(−12∑i=1n(xi−θ)2).=(2π)n/2exp(−n2(θ2−2x¯θ+x¯¯))=(2π)n/2exp(−nx¯¯2)⋅exp(−n2(θ2−2x¯θ))
Ora, possiamo lavorare direttamente con questa densità di campionamento, se vogliamo. Ma nota che i primi due termini in questa densità sono costanti moltiplicative che non dipendono da . È fastidioso tenere traccia di questi termini, quindi eliminiamoli, quindi abbiamo la funzione di probabilità:θ
Lx(θ)=exp(−n2(θ2−2x¯θ)).
Questo semplifica un po 'le cose, dal momento che non dobbiamo tenere traccia di un termine aggiuntivo. Ora, potremmo applicare la regola di Bayes usando la sua versione completa dell'equazione, incluso il denominatore integrale. Ma ancora una volta, questo ci richiede di tenere traccia di un'altra fastidiosa costante moltiplicativa che non dipende da (più fastidiosa perché dobbiamo risolvere un integrale per ottenerlo). Quindi applichiamo la regola di Bayes nella sua forma proporzionale. Usando il coniugato precedente , con alcuni parametri di precisione noti , otteniamo il seguente risultato ( completando il quadrato ):θθ∼N(0,λ0)λ0>0
p(θ|x)∝Lx(θ)⋅p(θ)=exp(−n2(θ2−2x¯θ))⋅N(θ|0,λ0)∝exp(−n2(θ2−2x¯θ))⋅exp(−λ02θ2)=exp(−12(nθ2−2nx¯θ+λ0θ2))=exp(−12((n+λ0)θ2−2nx¯θ))=exp(−n+λ02(θ2−2nx¯n+λ0θ))∝exp(−n+λ02(θ−nn+λ0⋅x¯)2)∝N(θ∣∣nn+λ0⋅x¯,n+λ0).
Quindi, da questo lavoro possiamo vedere che la distribuzione posteriore è proporzionale a una densità normale. Poiché il posteriore deve essere una densità, ciò implica che il posteriore è quella densità normale:
p(θ|x)=N(θ∣∣nn+λ0⋅x¯,n+λ0).
Quindi, vediamo che a posteriori il parametro è normalmente distribuito con media posteriore e varianza data da:θ
E(θ|x)=nn+λ0⋅x¯V(θ|x)=1n+λ0.
Ora, la distribuzione posteriore che abbiamo derivato ha una costante di integrazione davanti ad essa (che possiamo trovare facilmente osservando la forma della distribuzione normale ). Ma nota che non dovevamo preoccuparci di questa costante moltiplicativa - tutte le nostre attività rimuovevano (o portavano) costanti moltiplicative ogni volta che questo semplificava la matematica. Lo stesso risultato può essere derivato mentre si tiene traccia delle costanti moltiplicative, ma questo è molto più disordinato.