Per la mia (molto modesta) comprensione dell'inferenza variazionale, si cerca di approssimare una distribuzione sconosciuta trovando una distribuzione che ottimizzi quanto segue:
Ogni volta che investo tempo nella comprensione dell'inferenza variazionale continuo a colpire questa formula e non posso fare a meno di sentire che mi manca il punto. Mi sembra di conoscere per calcolare KL (p || q) . Ma il punto era che non conoscevo questa distribuzione p .
È questo punto esatto che mi ha infastidito ogni volta che provo a leggere qualcosa di variazionale. Cosa mi sto perdendo?
MODIFICA :
Aggiungerò alcuni commenti extra qui a seguito della risposta di @wij, cercherò di essere più preciso.
Nei casi che mi interessano, sembra davvero perfettamente ragionevole considerare che quanto segue vale;
In questo caso potrei sapere che aspetto dovrebbe avere proporzionalmente perché avrò fatto una scelta di modello per e . Sarei quindi corretto nel dire che allora dovrei scegliere una distribuzione familiare [diciamo gaussiana] tale che ora posso stimare . Sembra che in questo caso stia cercando di adattarmi a un gaussiano che è vicino al non normalizzato . È corretto?
In tal caso, mi sembra di presumere che il mio posteriore sia una distribuzione normale e cerco semplicemente di trovare valori probabili per questa distribuzione in merito alla divergenza di .