Nell'algoritmo modello argomento LDA, ho visto questo presupposto. Ma non so perché ho scelto la distribuzione di Dirichlet? Non so se possiamo usare la distribuzione uniforme su Multinomial come coppia?
Nell'algoritmo modello argomento LDA, ho visto questo presupposto. Ma non so perché ho scelto la distribuzione di Dirichlet? Non so se possiamo usare la distribuzione uniforme su Multinomial come coppia?
Risposte:
La distribuzione di Dirichlet è un coniugato precedente per la distribuzione multinomiale. Ciò significa che se la distribuzione precedente dei parametri multinomiali è Dirichlet, anche la distribuzione posteriore è anche una distribuzione di Dirichlet (con parametri diversi da quelli del precedente). Il vantaggio di ciò è che (a) la distribuzione posteriore è facile da calcolare e (b) in un certo senso è possibile quantificare quanto sono cambiate le nostre convinzioni dopo aver raccolto i dati.
Si può certamente discutere se questi sono buoni motivi per scegliere un particolare precedente, poiché questi criteri non sono correlati alle credenze precedenti reali ... Tuttavia, i priori coniugati sono popolari, poiché spesso sono ragionevolmente flessibili e convenienti da usare per i motivi sopra indicati .
Nel caso speciale della distribuzione multinomiale, sia il vettore dei parametri multinomiali (ovvero le probabilità per le diverse categorie). Se prima di raccogliere i dati, quindi, date osservazioni nelle diverse categorie,
La distribuzione uniforme è in realtà un caso speciale della distribuzione di Dirichlet, corrispondente al caso . Così è il precedente Jeffreys meno informativo , per il quale . Il fatto che la classe Dirichlet includa questi priori naturali "non informativi" è un altro motivo per usarlo.
Inoltre, piuttosto che contraddire la risposta di Måns T , sottolineo semplicemente che non esiste "il priore" nella modellistica bayesiana! La distribuzione di Dirichlet è una scelta conveniente a causa di (a) coniugazione, (b) informatica e (c) connessione con statistiche non parametriche (poiché questa è la versione discretizzata del processo di Dirichlet).
Tuttavia, (i) qualunque cosa tu abbia precedentemente inserito sui pesi del multinomiale è una risposta legittima a livello soggettivo di Bayes e (ii) nel caso in cui siano disponibili informazioni precedenti, non vi è alcun motivo per semplificare in una distribuzione di Dirichlet. Si noti inoltre che le miscele e le convoluzioni delle distribuzioni di Dirichlet possono essere utilizzate come priori.