Perché i cut-off utilizzati per i fattori e i valori p di Bayes sono così diversi?


11

Sto cercando di capire Bayes Factor (BF). Credo che siano come un rapporto di verosimiglianza di 2 ipotesi. Quindi se BF è 5, significa che H1 è 5 volte più probabile di H0. E un valore di 3-10 indica prove moderate, mentre> 10 indica prove forti.

Tuttavia, per il valore P, tradizionalmente 0,05 viene preso come cut-off. A questo valore P, il rapporto di probabilità H1 / H0 dovrebbe essere di circa 95/5 o 19.

Quindi perché un cut-off di> 3 è preso per BF mentre un cut-off di> 19 è preso per valori P? Questi valori non sono neanche vicini da nessuna parte.


2
Sono a disagio nel dire "se BF è , significa che H 1 è 5 volte più probabile di H 0 ". Il fattore Bayes può essere un rapporto di probabilità marginale, ma non è un rapporto di probabilità o un rapporto di probabilità, e deve essere combinato con un precedente per essere utile5H15H0
Henry

Se non disponiamo di particolari informazioni preliminari, cosa possiamo dire sul significato di BF?
rnso

Certamente, si hanno "alcune" informazioni preliminari anche se si dice che non ci sono particolari informazioni precedenti. Vale a dire, in quel caso è ragionevole assegnare pari probabilità a ciascuna ipotesi secondo il principio di indifferenza. Questo è un semplice esempio di un cosiddetto priore non informativo (certamente un termine improprio).
dnqxt,

In questo caso BF di 5 indica un'ipotesi 5 volte più probabile?
rnso

Sì, ma questo problema è molto più complicato di quanto possa sembrare e rientra nell'area della selezione dei modelli nelle statistiche. Sei stato avvisato :))
dnqxt

Risposte:


10

Poche cose:

Il BF ti fornisce prove a favore di un'ipotesi, mentre un test di ipotesi frequentista ti fornisce prove contro un'ipotesi (nulla). Quindi è una specie di "mela alle arance".

Queste due procedure, nonostante la differenza nelle interpretazioni, possono portare a decisioni diverse. Ad esempio, un BF potrebbe rifiutare mentre un test di ipotesi del frequentatore non lo fa, o viceversa. Questo problema viene spesso definito il paradosso di Jeffreys-Lindley . Ci sono stati molti post su questo sito su questo; vedi ad esempio qui e qui .

"A questo valore P, la probabilità H1 / H0 dovrebbe essere 95/5 o 19." No, questo non è vero perché, approssimativamente p(yH1)1p(yH0) . Calcolare un valore p ed eseguire un test frequentista, come minimo, non richiede di avere idea di p(yH1) . Inoltre, i valori p sono spesso integrali / somme di densità / pmfs, mentre un BF non si integra nello spazio di campionamento dei dati.


2
H0H1p1(belief in H1)

1
p

2
H1 H0H0pH1p

1
p

1
pp

8

B01

P01=11+1B01
p

  1. P01
  2. il suo valore e intervallo dipendono dalla scelta della misura precedente, sono quindi relativi piuttosto che assoluti (e la menzione di Taylor del paradosso di Lindley-Jeffreys è appropriata in questa fase )
  3. B01P01

p p

Q01=P(B01(X)B01(xobs))
xobsX
XΘf(x|θ)π(θ|xobs)dθ


Usando la tua formula, P per BF di 3 e 10 risulta rispettivamente 0,75 e 0,91. Perché dovremmo accettarli come prove moderate dal momento che per il valore P manteniamo un limite di 0,95?
anche il

Perché è 0.95

La formula sembra più semplice comeP = B/(B+1)
anche il

2

Parte della tua confusione potrebbe derivare dal prendere il numero 95/5 direttamente dal fatto che il valore p è 0,05 - è questo che stai facendo? Non credo sia corretto. Il valore p di un test t, ad esempio, riflette la possibilità di ottenere la differenza osservata tra le medie o una differenza più estrema se l'ipotesi nulla è effettivamente vera. Se ottieni un valore di p di 0,02, dici 'ah, c'è solo una probabilità del 2% di ottenere una differenza come questa, o una differenza maggiore, se il valore nullo è vero. Sembra molto improbabile, quindi propongo che il nulla non sia vero! '. Questi numeri non sono la stessa cosa che va nel fattore di Bayes, che è il rapporto delle probabilità posteriori date a ciascuna ipotesi in competizione. Queste probabilità posteriori non sono calcolate allo stesso modo del valore p,

Come nota a margine, suggerirei fortemente di non pensare a valori BF diversi come significanti cose particolari. Questi incarichi sono completamente arbitrari, proprio come il livello di significatività .05. Problemi come il p-hacking si verificano altrettanto facilmente con i fattori di Bayes se le persone iniziano a credere che solo numeri particolari meritino di essere presi in considerazione. Cerca di capirli per quello che sono, che sono qualcosa come le probabilità relative, e usa il tuo senso per determinare se trovi un numero BF prove convincenti o meno.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.