Perché una


21

sfondo

Uno dei punti deboli più comunemente usati prima della varianza è la gamma inversa con i parametri (Gelman 2006) .α=0.001,β=0.001

Tuttavia, questa distribuzione ha un IC al 90% di circa .[3×1019,]

library(pscl)
sapply(c(0.05, 0.95), function(x) qigamma(x, 0.001, 0.001))

[1] 3.362941e+19          Inf

Da ciò, interpreto che l' dà una bassa probabilità che la varianza sia molto alta e la bassissima probabilità che la varianza sia inferiore a 1 P ( σ < 1 | α = 0,001 , β = 0,001 ) = 0,006 .iosol(0.001,0.001)P(σ<1|α=0.001,β=0.001)=0.006

pigamma(1, 0.001, 0.001)
[1] 0.006312353

Domanda

Mi sto perdendo qualcosa o è in realtà un precedente informativo?

aggiornamento per chiarire, il motivo per cui stavo prendendo in considerazione questo 'informativo' è perché afferma fortemente che la varianza è enorme e ben oltre la portata di quasi ogni varianza mai misurata.

follow-up una meta-analisi di un gran numero di stime di varianza fornirebbe un precedente più ragionevole?


Riferimento

Gelman 2006. Distribuzioni precedenti per parametri di varianza in modelli gerarchici . Analisi bayesiana 1 (3): 515-533


1
Un "vero" non informativo precedente non è una distribuzione. Quindi non esiste alcuna probabilità precedente come P (sigma <1).
Stéphane Laurent,

Risposte:


38

Usando la distribuzione gamma inversa, otteniamo:

p(σ2|α,β)α(σ2)-α-1exp(-βσ2)

Si può vedere facilmente che se e α 0 la gamma inversa si avvicinerà al Jeffreys precedente. Questa distribuzione è chiamata "non informativa" perché è un'approssimazione adeguata al precedente Jeffreysβ0α0

p(σ2)α1σ2

Il che non è informativo per i parametri di scala, vedi ad esempio qui a pagina 18 , perché questo precedente è l'unico che rimane invariante sotto un cambio di scala (si noti che l'approssimazione non è invariante). Questo ha un integrale indefinito di che mostra che non è corretto se l'intervallo di σ 2 include 0 o . Ma questi casi sono solo problemi di matematica, non nel mondo reale. Non osservare mai il valore infinito per la varianza e se la varianza osservata è zero, si hanno dati perfetti !. Perché puoi impostare un limite inferiore uguale a L > 0 e un limite superiore uguale a Ulog(σ2)σ20L>0 e la tua distribuzione è corretta.U<

Mentre può sembrare strano che questo sia "non informativo" in quanto preferisce una piccola varianza rispetto a quelli grandi, ma questo è solo su una scala. È possibile mostrare che il ha una distribuzione uniforme impropria. Quindi questo precedente non favorisce nessuna scala rispetto a nessun altralog(σ2)

Sebbene non sia direttamente correlato alla tua domanda, suggerirei una "migliore" distribuzione non informativa scegliendo i limiti superiore e inferiore e U nei Jeffreys precedenti piuttosto che α e β . Di solito i limiti possono essere impostati abbastanza facilmente con un po 'di pensiero su cosa significhi σ 2 nel mondo reale. Se si trattava dell'errore in una sorta di quantità fisica - L non può essere più piccola della dimensione di un atomo o della dimensione più piccola che puoi osservare nell'esperimento. Ulteriore ULUαβσ2LUnon potrebbe essere più grande della terra (o del sole se volessi essere davvero conservatore). In questo modo conservate le proprietà della vostra invarianza, ed è molto più facile prima del campionamento da: prendere , e quindi il valore simulato come σ 2 ( b ) = exp ( q ( b ) ) .q(B)~Unioform(log(L),log(U))σ(B)2=exp(q(B))


5
+1 per non solo rispondere alla domanda, ma anche fornire consigli utili.
whuber

log(σ)

Betun'2(1,1)F1,1Betun'2(0,0)
Probislogic

1
[0,]σ~eXp(U(log(L),log(U))σ~U(L,U)

(0,)α=1,β=1/2

10

È abbastanza vicino all'appartamento. La sua mediana è 1,9 E298, quasi il più grande numero uno può rappresentare in aritmetica galleggiante a doppia precisione. Come fai notare, la probabilità che assegna a qualsiasi intervallo che non è davvero enorme è davvero piccola. È difficile ottenere meno informazioni di così!


Grazie per la tua spiegazione. Mi sono imbattuto in problemi di convergenza e sono rimasto sorpreso dal fatto che molte delle variabili con cui lavoro hanno un valore <1000 (ovvero se qualcosa è> 1000 g viene misurato in kg) e le variazioni sono circa nello stesso ordine di grandezza. Quindi, mi sto rendendo conto che ho bisogno di più priori che incorporino queste informazioni anche se non ho una buona conoscenza preliminare del suo valore o di come è partizionato.
David LeBauer,

A seconda del modello, il tuo posteriore potrebbe essere molto vicino a un uso improprio di questo precedente
JMS
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.