Ci sono stati studi su larga scala dei metodi MCMC che hanno confrontato le prestazioni di diversi algoritmi su una suite di densità di test? Sto pensando a qualcosa di equivalente al documento di Rios e Sahinidis (2013), che è un confronto approfondito di un gran numero di ottimizzatori della scatola nera privi di derivati su diverse classi di funzioni di test.
Per MCMC, le prestazioni possono essere stimate, ad esempio, in un numero effettivo di campioni (ESS) per valutazione della densità o in qualche altra metrica appropriata.
Alcuni commenti:
Apprezzo che le prestazioni dipenderanno fortemente dai dettagli del pdf di destinazione, ma un argomento simile (forse non identico) vale per l'ottimizzazione, e tuttavia esiste una pletora di funzioni di benchmark, suite, competizioni, documenti, ecc. Che si occupa dell'ottimizzazione del benchmarking algoritmi.
Inoltre, è vero che MCMC differisce dall'ottimizzazione in quanto, comparativamente, sono necessarie molta più cura e messa a punto da parte dell'utente. Tuttavia, ora ci sono diversi metodi MCMC che richiedono poca o nessuna messa a punto: metodi che si adattano nella fase di burn-in, durante il campionamento o metodi multi-stato (chiamati anche ensemble ) (come Emcee ) che evolvono più catene interagenti e utilizzano informazioni da altre catene per guidare il campionamento.
Sono particolarmente interessato al confronto tra metodi standard e multistato (aka ensemble). Per la definizione di multistato, consultare la Sezione 30.6 del libro di MacKay :
In un metodo multi-stato, vengono mantenuti più vettori di parametri ; si evolvono individualmente con mosse come Metropolis e Gibbs; ci sono anche interazioni tra i vettori.
- Questa domanda è nata da qui .
Aggiornare
- Per un'interessante interpretazione dei metodi degli ensemble multistato aka, vedere questo post di Bob Carpenter sul blog di Gelman e il mio commento in riferimento a questo post del CV.