Perché la distribuzione posteriore nell'inferenza bayesiana è spesso intrattabile?


15

Ho un problema a capire perché l'inferenza bayesiana porta a problemi intrattabili. Il problema viene spesso spiegato in questo modo:

inserisci qui la descrizione dell'immagine

Quello che non capisco è perché questo integrale debba essere valutato in primo luogo: mi sembra che il risultato dell'integrale sia semplicemente una costante di normalizzazione (come viene dato il set di dati D). Perché non si può semplicemente calcolare la distribuzione posteriore come numeratore del lato destro e quindi dedurre questa costante di normalizzazione richiedendo che l'integrale sulla distribuzione posteriore debba essere 1?

Cosa mi sto perdendo?

Grazie!


6
A chi può interessare: questa domanda è assolutamente in argomento perché si tratta di statistiche.
Sycorax dice di reintegrare Monica il

3
L'estratto è scritto male. Essere consapevoli del fatto che non è la distribuzione posteriore; è la probabilità incondizionata dei dati (cioè, indipendentemente da theta). Poiché P ( D ) sarà lo stesso per tutti i modelli considerati per lo stesso set di dati, non è necessario che sia necessariamente calcolato. In caso contrario, è sufficiente modificare il segno di uguale in "proporzionale a" ( ). P(D)P(D)
gung - Ripristina Monica

Potresti fornire il riferimento di quella diapositiva come presumo sia stata scritta da qualcun altro?
Xi'an,

3
p(D)

Attualmente stiamo organizzando un seminario sulla normalizzazione delle costanti in cui è possibile trovare voci interessanti per rispondere a questa domanda.
Xi'an,

Risposte:


7

Perché non si può semplicemente calcolare la distribuzione posteriore come numeratore del lato destro e quindi dedurre questa costante di normalizzazione richiedendo che l'integrale sulla distribuzione posteriore debba essere 1?

P(θ|D)=p(D|θ)P(θ)P(D).

P(D|θ)P(θ)θc

θcP(D|θ)P(θ)dθ=1θcP(D,θ)dθ=1cP(D)=1c=1P(D).

P(D)


θ

0

Ho avuto la stessa domanda. Questo fantastico post lo spiega davvero bene.

In poche parole. È intrattabile perché il denominatore deve valutare la probabilità di TUTTI i possibili valori di 𝜃; nella maggior parte dei casi interessanti TUTTO è una grande quantità. Considerando che il numeratore è per una singola realizzazione di 𝜃.

Vedi Eq. 4-8 nel post. Schermata del collegamento:

Here is an screenshot of the link

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.