Valori mancanti nella variabile di risposta in JAGS


10

Gelman & Hill (2006) dicono:

In Bugs, i risultati mancanti in una regressione possono essere gestiti facilmente includendo semplicemente il vettore di dati, i NA e tutti. I bug modellano esplicitamente la variabile di risultato, quindi è banale usare questo modello per, in effetti, imputare i valori mancanti ad ogni iterazione.

Sembra un modo semplice di usare JAGS per fare previsioni. Ma le osservazioni con i risultati mancanti influenzano anche le stime dei parametri? In tal caso, esiste un modo semplice per conservare queste osservazioni nel set di dati che JAGS vede, ma non farle influenzare le stime dei parametri? Stavo pensando alla funzione di taglio, ma è disponibile solo in BUGS, non in JAGS.

Risposte:


11

Sì, è davvero facile da usare in BUGS o JAGS! In realtà è un piacere usarlo!

Ma le osservazioni con i risultati mancanti influenzano anche le stime dei parametri?

Ovviamente no. I parametri sono influenzati solo dai risultati osservati. I risultati mancanti (NA) non influiranno su nulla, in realtà è il contrario: i risultati mancanti verranno derivati ​​dai parametri. Si noti che i risultati mancanti avranno anche la sua distribuzione posteriore. Quindi è molto facile calcolare alcune quantità derivate, ad esempio una somma sugli indici del risultato, e queste quantità derivate non solo sono gestite per valori mancanti, ma hanno anche immediatamente la loro distribuzione posteriore. Questo è ciò che è così sexy su BUGS & JAGS!

Divertiti!


1
Spiacenti, non sono convinto che i risultati mancanti non influiscano sulle stime dei parametri. Jackman sembra dire il contrario: jackman.stanford.edu/blog/?p=38
Jack Tanner

@ JackTanner, pensaci un po '. In che modo il valore mancante può influire su qualcosa? All'avvio dell'algoritmo, il valore mancante inizierà a essere imputato dalle stime dei parametri (che derivano dai risultati osservati). Quindi (forse, non sono sicuro), le informazioni dal risultato mancante imputato possono tornare ai parametri, ma non importa: sono solo le informazioni originali, presenti nei parametri, restituite a loro. Le informazioni REALI che influenzano qualcosa provengono solo dai risultati REALI. Se non ti fidi di me, fai una simulazione, confronta i risultati e pubblica qui.
Curioso

Per quanto riguarda il tuo link, apparentemente non ne è sicuro, dice "problema" - tra virgolette, e dice "sarebbe interessante confrontarlo". Dico che non ci saranno differenze significative. Se vuoi provarlo, vai avanti.
Curioso

3
Sono d'accordo; nessuna differenza significativa. Uso questo approccio per costruire distribuzioni predittive posteriori; basta inserire i valori predittivi delle variabili del lato destro insieme ai valori passati e le NA per la variabile target "osservazioni" corrispondenti ai valori predittivi.
jbowman,

@jbowman, sì, buona nota! Non è un'idea ovvia fare previsioni in questo modo!
Curioso
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.