Stavo esaminando la documentazione di Stan che può essere scaricata da qui . Ero particolarmente interessato alla loro implementazione della diagnostica Gelman-Rubin. Il documento originale Gelman & Rubin (1992) definisce il potenziale fattore di riduzione della scala (PSRF) come segue:
Let sia la i esima catena di Markov campionata, e ci sia della complessivi M catene indipendenti nel campione. Sia ˉ X i ⋅ la media della I catena, e ˉ X ⋅ ⋅ la media complessiva. Definisci, W = 1 dove s 2 m =1
Definire V = ( N - 1
La documentazione di Stan a pagina 349 ignora il termine con e rimuove anche il termine moltiplicativo ( M + 1 ) / M. Questa è la loro formula,
Lo stimatore di varianza è Infine, il potenziale di riduzione statistica scala è definito da R = √
Da quello che ho potuto vedere, non forniscono un riferimento per questo cambio di formula, né ne discutono. Di solito non è troppo grande e può spesso essere basso, quindi 2 , quindi ( M + 1 ) / M non deve essere ignorato, anche se dtermine f può essere approssimato con 1.
Da dove viene questa formula?
EDIT: ho trovato una risposta parziale alla domanda "da dove proviene questa formula? ", In quanto il libro Bayesian Data Analysis di Gelman, Carlin, Stern e Rubin (Seconda edizione) ha esattamente la stessa formula. Tuttavia, il libro non spiega come / perché è giustificabile ignorare quei termini?