In che modo i bayesiani confrontano le distribuzioni?


25

Quindi, penso di avere una buona conoscenza delle basi della probabilità frequentista e dell'analisi statistica (e di quanto male possa essere usato). In un mondo frequentista, ha senso porre una domanda come "questa distribuzione è diversa da quella distribuzione", perché si presume che le distribuzioni siano reali, oggettive e immutabili (almeno per una determinata situazione), e quindi possiamo capire la probabilità che un campione sia estratto da una distribuzione a forma di come un altro campione.

Nella visione del mondo bayesiano, ci preoccupiamo solo di ciò che ci aspettiamo di vedere, date le nostre esperienze passate (sono ancora un po 'vago in questa parte, ma capisco il concetto di aggiornamento bayesiano). Se è così, come può un bayesiano dire "questa serie di dati è diversa da quella serie di dati"?

Ai fini di questa domanda, non mi interessa il significato statistico, o simili, solo come quantificare la differenza. Sono ugualmente interessato alle distribuzioni parametriche e non parametriche.


Potresti chiarire cosa intendi con "questo set di dati è diverso da quel set di dati?" Come in, ti riferisci al confronto tra due o più gruppi, come i redditi dei maschi contro i redditi delle femmine? O forse come fa un bayesiano a confrontare due campioni di reddito senza conoscenza del genere?
Ramhiser,

2
@ JohnA.Ramey: qual è la differenza? Una volta che sono tutti numeri, "maschio" e "femmina" non sono solo etichette per i campioni?
naught101

Risposte:


13

Pensa alla tua dichiarazione come Frequentista e rendila prima più specifica. Un frequentatore non potrebbe dire che "il set di dati A è diverso dal set di dati B", senza ulteriori chiarimenti.

Innanzitutto, dovresti dichiarare cosa intendi con "diverso". Forse vuoi dire "hanno valori medi diversi". Quindi, potresti voler dire "avere varianze diverse". O forse qualcos'altro?

Quindi, dovresti indicare quale tipo di test utilizzeresti, che dipende da ciò che ritieni siano presupposti validi sui dati. Supponete che i set di dati siano entrambi distribuiti normalmente su alcuni mezzi? O credi che siano entrambi distribuiti in beta? O qualcos'altro?

Ora vedi che la seconda decisione è molto simile ai priori nelle statistiche bayesiane? Non è solo "la mia esperienza passata", ma è piuttosto ciò in cui credo, e ciò in cui credo che i miei colleghi crederanno, sono ipotesi ragionevoli sui miei dati. (E i bayesiani possono usare priori uniformi, che spingono le cose verso i calcoli del frequentista.)

EDIT: in risposta al tuo commento: il passaggio successivo è contenuto nella prima decisione che ho citato. Se vuoi decidere se le medie di due gruppi sono diverse, dovresti esaminare la distribuzione della differenza delle medie dei due gruppi per vedere se questa distribuzione contiene o non contiene zero, a un certo livello di confidenza. Esattamente quanto vicino a zero conti come zero ed esattamente quale parte della distribuzione (posteriore) che usi è determinata da te e dal livello di fiducia che desideri.

Una discussione di queste idee può essere trovata in un articolo di Kruschke , che ha anche scritto un libro molto leggibile Doing Bayesian Data Analysis , che copre un esempio alle pagine 307-309, "I gruppi diversi sono uguali?". (Seconda edizione: p. 468-472.) Ha anche un post sul blog sull'argomento , con alcune domande e risposte .

ULTERIORI MODIFICHE: anche la descrizione del processo bayesiano non è del tutto corretta. Ai bayesiani interessa solo ciò che i dati ci dicono, alla luce di ciò che sapevamo indipendentemente dai dati. (Come sottolinea Kruschke, il precedente non si verifica necessariamente prima dei dati. Questo è ciò che implica la frase, ma è in realtà solo la nostra conoscenza che esclude alcuni dei dati.) Ciò che sapevamo indipendentemente da un determinato insieme di dati può essere vago o specifico e può essere basato sul consenso, un modello del processo di generazione dei dati sottostante o potrebbe essere solo il risultato di un altro esperimento (non necessariamente precedente).


Sì, ok, i frequentatori assumono una distribuzione, e questo è soggettivo. Ma poi possono semplicemente misurare i parametri di ogni campione, con errore, e dire "ok, questi sono i parametri della popolazione reale di ciascun campione, e ora qual è la probabilità che la differenza sia dovuta solo all'errore di campionamento". La mia domanda riguarda il passaggio successivo alla tua risposta: in che modo Bayesiano inferisce le differenze tra i campioni (supponiamo che i campioni provengano dallo stesso tipo di distribuzione, parametrici o meno).
naught101

@ naught101: vedi la mia modifica.
Wayne,

@Wayne il documento che hai collegato è eccellente. Grazie per aver condiviso
Cam.Davidson.Pilon il

@ naught101: ho aggiornato il link al blog. Evidentemente ha mantenuto le versioni precedenti dell'articolo e ciascuna si collega a una più recente, e quella a cui ho collegato per la prima volta è tre versioni non aggiornate.
Wayne,

Questo è un metodo piuttosto interessante e chiarisce davvero come potrebbe funzionare l'inferenza bayesiana (trattando i parametri di distribuzione come fonte di incertezza). Peccato che sia così intenso dal punto di vista computazionale. Inoltre, l'uso di IC al 95% sembra un po 'troppo simile all'impostazione di un livello di significatività, ma non riesco a vedere se esiste un modo reale per ottenere un equivalente riferibile di un valore p (forse la somma delle probabilità di valori più estremo di 0 dalla media, per la differenza in mezzo?).
naught101

14

questo documento potrebbe essere interessante: http://arxiv.org/pdf/0906.4032v1.pdf

Fornisce un bel riassunto di alcuni approcci frequentisti e bayesiani al problema dei due campioni e discute sia i casi parametrici che non parametrici.

Potrebbe aggiungere qualcosa alle altre risposte per fare un semplice esempio. Diciamo che hanno due insiemi di dati ed y dove ogni x i ed ogni y j è o un 0 o 1 . Assumi un modello iid di Bernoulli in entrambi i casi, quindi ogni x iB e r n ( p ) e ogni y iB e r n ( q ) . Il tuo scenario di test di ipotesi sia in ambito frequentista che bayesiano può essere:xyxiyj01xiBern(p)yiBern(q)

H0:p=q

non necessariamente uguale.H1:p,q

Le probabilità per i dati in ciascun caso sono:

Sotto : L 0 ( p ) = f ( x , y ; p ) = i p i ( 1 - p ) 1 - ij p j ( 1 - p ) 1 - jH0L0(p)=f(x,y;p)=ipi(1p)1ijpj(1p)1j

H1L1(p,q)=f(x,y;p,q)=ipi(1p)1ijqj(1q)1j

H0q=p

W=2log{L0(pmax)L1(pmax,qmax)},

pmax,qmaxpqpmaxpmaxWχ12H0

pπ0H0p,qπ1H1

BF=f(x,y|H0)f(x,y|H1)=01L0(p)π0(p)dp0101L1(p,q)π1(p,q)dpdq.

The Bayes factor can be combined with some prior beliefs on the probability of H0 or H1 being true, to give the probability of H0 versus H1 after seeing the data. If we assume apriori that each hypothesis is equally likely, so p(H0)=p(H1)=1/2, then this gives:

p(H0|x,y)p(H1|x,y)=BF×p(H0)p(H1)=BF×1/21/2=BF.

Intuitively, if this ratio is >1, then the posterior probability of H0 is larger than H1, so you would say that H0 has a higher probability of being true under these assumptions for the prior and model.

One nice thing about the Bayes factor is how it automatically penalises more complex models (such as H1 here). A nice paper offering some more intuition is here: http://quasar.as.utexas.edu/papers/ockham.pdf.

Hope that helps along with the other answers already posted.


0

Given data, how strongly do we believe that 2 groups do not come from the same population (H_1: they do not come from the same population vs H_0: they come from the same population). This can be done with a Bayesian t-test.

Complexity is used to figure out how much the prior is overlapping with one hypothesis. Fit is used to figure out how much the posterior is overlapping with one hypothesis. Combined you can compare the hypotheses and express your posterior belief in whether or not they come from the same population.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.