Quali distribuzioni precedenti potrebbero / dovrebbero essere utilizzate per la varianza in un modello gerarchico bayesisan quando la varianza media è interessante?


16

Nel suo ampiamente citato documento Distribuzioni precedenti per parametri di varianza in modelli gerarchici (916 citazione finora su Google Scholar) Gelman propone che buone distribuzioni precedenti non informative per la varianza in un modello bayesiano gerarchico siano la distribuzione uniforme e la distribuzione della mezza t. Se capisco bene le cose, questo funziona bene quando è il parametro location (ad es. La media) di interesse principale. A volte, tuttavia, il parametro varianza è di interesse principale, ad esempio quando si analizzano i dati di risposta umana dalle attività di temporizzazione, la variabilità di temporizzazione è spesso la misura di interesse. In quei casi non mi è chiaro come la variabilità possa essere modellata gerarchicamente con, ad esempio, distribuzioni uniformi, poiché dopo l'analisi voglio ottenere la credibilità della varianza media sia a livello di partecipanti che a livello di gruppo.

La mia domanda è quindi: quali sono le distribuzioni consigliate quando si costruisce un modello bayesiano gerarchico quando la varianza dei dati è di interesse principale?

So che la distribuzione gamma può essere riparata per essere specificata con media e SD. Ad esempio, il modello gerarchico di seguito è tratto dal libro di Kruschke Doing Bayesian Data Analysis . Ma Gelman delinea alcuni problemi con la distribuzione gamma nel suo articolo e sarei grato per suggerimenti di alternative, preferibilmente alternative che non sono difficili da far funzionare in BUGS / JAGS.

inserisci qui la descrizione dell'immagine

Risposte:


2

Non sono d'accordo con il modo in cui interpreti Gelman in merito alla scelta del parametro Gamma per scala. La base della modellazione gerarchica è quella di mettere in relazione i singoli parametri con uno comune attraverso una struttura con parametri sconosciuti (tipicamente media e varianza). In questo senso, usare una distribuzione gamma per la varianza individuale (o lognormale per la coda più pesante) condizionata alla varianza media e la sua dispersione mi sembra valida (almeno per quanto riguarda gli argomenti di Gelman).

I critici di Gelman circa il gamma per il parametro di scala sono circa il fatto che il gamma è usato per approssimare i Jeffrey impostando valori estremi sul suo parametro. Il problema è che a seconda di quanto estremi siano questi valori (il che è abbastanza arbitrario) il posteriore può essere molto diverso. Questa osservazione invalida l'uso di questo precedente, almeno quando non abbiamo informazioni da impostare nel precedente. In questa discussione, mi sembra che la gamma o gamma inversa non sia mai calibrata in termini di media e varianza dalle informazioni precedenti o da una struttura gerarchica. Quindi la sua raccomandazione riguarda un contesto alquanto diverso dal tuo che, se capisco bene il tuo scopo,


0

In breve, Gelman delinea i problemi nell'uso delle distribuzioni Gamma come vaghi priori (usa la parola non informativa ) per la varianza. Al contrario, il tuo problema (e l'esempio del Kruschke) sembra riferirsi al caso in cui esiste una certa conoscenza della varianza. Si noti inoltre che l'immagine della distribuzione della varianzaτio non è affatto piatto.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.