Qual è una buona analogia per illustrare i punti di forza dei modelli gerarchici bayesiani?


10

Sono relativamente nuovo alle statistiche bayesiane e recentemente ho usato JAGS per costruire modelli bayesiani gerarchici su diversi set di dati. Mentre sono molto soddisfatto dei risultati (rispetto ai modelli glm standard), devo spiegare ai non statistici quale sia la differenza con i modelli statistici standard. In particolare, vorrei illustrare perché e quando gli HBM funzionano meglio dei modelli più semplici.

Un'analogia sarebbe utile, in particolare quella che illustra alcuni elementi chiave:

  • i molteplici livelli di eterogeneità
  • la necessità di ulteriori calcoli per adattarsi al modello
  • la capacità di estrarre più "segnale" dagli stessi dati

Nota che la risposta dovrebbe davvero essere un'analogia illuminante per le persone non statistiche, non un esempio facile e piacevole da seguire.


4
Il classico problema delle "otto scuole" sembra un ottimo candidato all'introduzione degli HBM. andrewgelman.com/2014/01/21/…
Sycorax afferma di

2
@ cafe876. Non vedo come la natura bayesiana della modellazione sia specifica per il tuo punto. La tua domanda è davvero specifica per il modello gerarchico bayesiano? o semplicemente al modello gerarchico?
peuhp

@peuhp dalla mia esperienza il framework bayesiano rende possibile la stima di modelli molto più complessi.
nassimhddd,

Risposte:


3

Vorrei illustrare un esempio di modellizzazione relativa al tasso di cancro (come in Johnson and Albert 1999). Toccerà il primo e il terzo elemento di tuo interesse.
Quindi il problema è prevedere i tassi di cancro in varie città. Supponiamo di avere dati sul numero di persone in varie città e sul numero di persone decedute per cancro . Supponiamo di voler stimare i tassi di cancro . Esistono vari modi per modellarli e come vediamo problemi con ciascuno di essi. Vedremo come la modellazione heirachical bayes può superare qualche problema. 1. Un modo è quello di fare una stima separatamente, ma soffriremo di un problema di dati scarsi e saremmo sottovalutati delle tariffe come per basso .x i θ i N i θ i θ i θ i x iB i n ( N i , θ i ) θ iB e t a ( a , b ) p ( D , θ , η | N ) = p ( η ) N i = 1 B iNixiθi
Ni
2. Un altro approccio per gestire il problema dei dati sparsi sarebbe quello di usare lo stesso per tutte le città e legare i parametri, ma questo è anche un presupposto molto forte. 3. Quindi ciò che si potrebbe fare è che tutti i sono simili in qualche modo ma anche con variazioni specifiche della città. Quindi si potrebbe modellare in modo tale che tutti i siano disegnati da una distribuzione comune. Di ' e Una distribuzione articolare completa sarebbe quindi dove . Dobbiamo dedurreθi
θiθiXio~Bion(Nio,θio)θio~Betun'(un',B)
η = ( a , b ) η θ i η θ ip(D,θ,η|N)=p(η)Πio=1NBion(Xio|Nio,θio)Betun'(θio|η)η=(un',B)ηdai dati. Se viene bloccato su una costante, le informazioni non scorreranno tra e saranno condizionatamente indipendenti. Ma trattando come incognite, consentiamo alle città con meno dati di prendere in prestito la forza statistica dalle città con più dati. L'idea principale è quella di più bayesiani e di assegnare i priori ai priori per modellare l'incertezza negli iperparametri. Ciò consente il flusso di influenza tra in questo esempio.θioη
θio


Grazie, questo è un esempio davvero carino, tuttavia non è un'analogia. Sto davvero cercando qualcosa che posso spiegare a un non statistico.
nassimhddd,

Immagino che la condivisione e la variazione a diversi livelli possano essere utilizzate per i non statistici.
dksahuji,

è vero, ma non c'è una storia più semplice per illustrare questo?
nassimhddd,

3

Quando sei malato, osservi i sintomi ma quello che vuoi è una diagnosi. Se non sei un medico, immagino che puoi semplicemente trovare la diagnosi che meglio si adatta ai tuoi sintomi. Ma ciò che Ph HBM farebbe è guardare ai tuoi sintomi, alla loro relativa significatività, al modo in cui si adattano / mettono in relazione i tuoi diversi problemi di salute precedenti, quello della tua famiglia, le attuali malattie e condizioni ambientali comuni, la tua debolezza, la tua forza ... e poi combinerà queste cose usando le sue conoscenze per aggiornare ciò che immagina delle tue condizioni di salute e ti darà la diagnosi più probabile.

Sono sicuro che questa analogia raggiungerà il suo limite abbastanza presto, ma penso che possa dare una buona intuizione di cosa ci si aspetterebbe da un HBM, vero? (e non ne ho trovato uno migliore)


Mi piace quell'analogia! Forse aggiungo un po 'di
peso

Un bell'esempio ... dove penso che non riesca a capire che sembra che la forza di HBM risieda nell'accesso a PIÙ informazioni (storia, famiglia, ecc.); mentre voglio esprimere che HBM è più sofisticato con le informazioni SAME. C'è un modo per adattare la tua storia?
nassimhddd,

@ cafe876. Grazie, lasciami un po 'di tempo per pensarci.
peuhp
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.