L'idea di base dell'aggiornamento bayesiano è quella data alcuni dati X e un precedente parametro di interesse θ , dove la relazione tra dati e parametro è descritta usando la funzione di verosimiglianza , si usa il teorema di Bayes per ottenere posteriore
p(θ∣X)∝p(X∣θ)p(θ)
Questo può essere fatto in sequenza, dove dopo aver visto il primo punto dati precedente θ si aggiorna al posteriore θ ′ , successivamente è possibile prendere il secondo punto dati x 2 e utilizzare il posteriore ottenuto prima di θ ′ come precedente , per aggiornarlo di nuovo ecc.x1 θ θ′x2θ′
Lasciate che vi faccia un esempio. Immagina di voler stimare la media della distribuzione normale e che σ 2 ti è noto. In tal caso possiamo usare il modello normale-normale. Partiamo dal presupposto normale per μ con iperparametri μ 0 , σ 2 0 :μσ2μμ0,σ20:
X∣μμ∼Normal(μ, σ2)∼Normal(μ0, σ20)
Poiché la distribuzione normale è un coniugato precedente per della distribuzione normale, abbiamo una soluzione in forma chiusa per aggiornare il precedenteμ
E(μ′∣x)Var(μ′∣x)=σ2μ+σ20xσ2+σ20=σ2σ20σ2+σ20
Sfortunatamente, tali semplici soluzioni in forma chiusa non sono disponibili per problemi più sofisticati e devi fare affidamento su algoritmi di ottimizzazione (per stime puntuali utilizzando il massimo approccio a posteriori ) o simulazione MCMC.
Di seguito puoi vedere un esempio di dati:
n <- 1000
set.seed(123)
x <- rnorm(n, 1.4, 2.7)
mu <- numeric(n)
sigma <- numeric(n)
mu[1] <- (10000*x[i] + (2.7^2)*0)/(10000+2.7^2)
sigma[1] <- (10000*2.7^2)/(10000+2.7^2)
for (i in 2:n) {
mu[i] <- ( sigma[i-1]*x[i] + (2.7^2)*mu[i-1] )/(sigma[i-1]+2.7^2)
sigma[i] <- ( sigma[i-1]*2.7^2 )/(sigma[i-1]+2.7^2)
}
Se traccia i risultati, vedrai come il valore posteriore si avvicina al valore stimato (il suo valore reale è contrassegnato da una linea rossa) man mano che vengono accumulati nuovi dati.
Per saperne di più puoi consultare quelle diapositive e l'analisi coniugale bayesiana del documento di distribuzione gaussiana di Kevin P. Murphy. Controlla anche I priori bayesiani diventano irrilevanti con campioni di grandi dimensioni? Puoi anche controllare quelle note e questo post di blog per un'introduzione passo-passo accessibile all'inferenza bayesiana.