Esempi di approccio bayesiano e frequentista che danno risposte diverse


54

Nota: sono consapevole delle differenze filosofiche tra statistiche bayesiane e frequentiste.

Ad esempio, "qual è la probabilità che la moneta sul tavolo sia testa" non ha senso nelle statistiche del frequentista, dal momento che ha già ottenuto testa o croce - non c'è nulla di probabilistico al riguardo. Quindi la domanda non ha risposta in termini di frequentista.

Ma tale differenza è un particolare non è il tipo di differenza che sto chiedendo.

Piuttosto, vorrei sapere come le loro previsioni per domande ben formate differiscono effettivamente nel mondo reale, escludendo eventuali differenze teoriche / filosofiche come l'esempio che ho menzionato sopra.

Quindi in altre parole:

Qual è un esempio di domanda, rispondente sia alle statistiche frequentiste che bayesiane, la cui risposta è diversa tra le due?

(es. forse uno di loro risponde "1/2" a una domanda particolare e l'altro risponde "2/3".)

Ci sono differenze del genere?

  • In tal caso, quali sono alcuni esempi?

  • In caso contrario, quando fa davvero la differenza se uso le statistiche bayesiane o frequentiste quando risolvo un problema particolare?
    Perché dovrei evitare l'uno a favore dell'altro?


8
John Kruschke ha appena prodotto due video in cui confronta i metodi bayesiani e quelli statistici standard. Ha molti esempi in cui il metodo bayesiano rifiuta ma il metodo standard no. Forse non esattamente quello che stavi cercando, ma comunque ... youtu.be/YyohWpjl6KU e youtu.be/IhlSD-lIQ_Y .
Rasmus Bååth,

4
N0NN0N

@Procrastinator: Grazie, sto guardando le diapositive menzionate in questo momento. Questo sembra un po 'più intenso del mio background matematico, ma spero di ottenere qualcosa da esso. :)
Mehrdad,

2
Potresti dare un'occhiata all'esempio di Stone. Lo spiego sul mio blog qui: normaldeviate.wordpress.com/2012/12/08/…
Larry Wasserman,

1
@mbq: Mi stavo chiedendo, perché questo wiki della community è stato creato?
Mehrdad,

Risposte:


9

Questo esempio è tratto da qui . (Penso anche di aver ottenuto questo link da SO, ma non riesco più a trovarlo.)

n=14k=10θθ

f(yf,1=heads,yf,2=heads|θ)=f(yf,1=heads)f(yf,2=heads|θ)=θ2.
Beta(α0,β0)
f(yf,1=heads,yf,2=heads|y)=f(yf,1=heads,yf,2=heads|θ)π(θ|y)dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)θ2θα0+k1(1θ)β0+nk1dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)Γ(α0+k+2)Γ(β0+nk)Γ(α0+β0+n+2)=(α0+k)(α0+k+1)(α0+β0+n)(α0+β0+n+1)
Beta(1,1)(10/14)2.51

+1 esattamente il tipo di risposta che stavo cercando, grazie.
Mehrdad,

5
In realtà c'è stato un aggiornamento al post a cui fa riferimento la risposta ... Anche se ha lasciato il post in alto ", invece di utilizzare la distribuzione uniforme come precedente, possiamo essere ancora più agnostici. In questo caso, possiamo usare la Beta ( 0,0) distribuzione come precedente. Tale distribuzione corrisponde al caso in cui qualsiasi mezzo di distribuzione è ugualmente probabile. In questo caso, i due approcci, bayesiano e frequentista danno gli stessi risultati. " !!! Quindi abbiamo ancora bisogno di un esempio per rispondere a questa domanda! Quindi +1 alla risposta di seguito come la vera risposta a questa domanda.
user1745038

10

Vedi la mia domanda qui , che menziona un articolo di Edwin Jaynes che fornisce un esempio di un intervallo di confidenza frequentista correttamente costruito, in cui vi sono informazioni sufficienti nel campione per sapere con certezza che il vero valore della statistica non si trova da nessuna parte nell'intervallo di confidenza ( e quindi l'intervallo di confidenza è diverso dall'intervallo credibile bayesiano).

Tuttavia, la ragione di ciò è la differenza nella definizione di un intervallo di confidenza e un intervallo credibile, che a sua volta è una conseguenza diretta della differenza nelle definizioni di probabilità frequentista e bayesiana. Se chiedi a un bayesiano di produrre un intervallo di confidenza bayesiana (piuttosto che credibile), allora sospetto che ci sarà sempre un precedente per il quale gli intervalli saranno gli stessi, quindi le differenze dipendono dalla scelta del precedente.

Se i metodi frequentista o bayesiano sono appropriati dipende dalla domanda che vuoi porre, e alla fine è la differenza nelle filosofie che decide la risposta (a condizione che lo sforzo computazionale e analitico richiesto non sia una considerazione).

Essendo in qualche modo ironico, si potrebbe sostenere che una frequenza a lungo termine è un modo perfettamente ragionevole per determinare la plausibilità relativa di una proposizione, nel qual caso le statistiche dei frequentisti sono un sottoinsieme leggermente strano del bayesianismo soggettivo - quindi qualsiasi domanda a cui un frequentatore può rispondere un bayesiano soggettivista può anche rispondere allo stesso modo, o in qualche altro modo se scelgono priori diversi. ; O)


4
L'uso del "bayesiano soggettivo" è un po 'un auto-sabotaggio ( vedi ). La modellazione in generale è piena di soggettivismo, anche la scelta di una distribuzione per modellare un campione è soggettiva. Anche la scelta di un test di bontà di adattamento per verificare se un determinato modello è ragionevole è soggettiva.

2
Non sono davvero d'accordo con questo, se qualcuno considera "soggettivo" come un peggiorativo, questo è il loro errore. A volte quando intendiamo probabilità, intendiamo davvero credenza personale soggettiva - non vedo alcuna ragione per non chiamarla così se questo è ciò che si intende realmente (scegliere di accettare solo frequenze a lungo termine come definizione di probabilità è una scelta puramente soggettiva).
Dikran Marsupial,

1
+1 grazie per il link, è molto illuminante. E anche per la nota sulla differenza tra fiducia e intervalli credibili.
Mehrdad,

8

Credo che questo documento fornisca un senso più mirato dei compromessi nelle applicazioni effettive tra i due. Parte di ciò potrebbe essere dovuta alla mia preferenza per gli intervalli piuttosto che per i test.

Gustafson, P. and Greenland, S. (2009). Stima dell'intervallo per dati osservativi disordinati . Statistical Science 24: 328–342.

Per quanto riguarda gli intervalli, può essere utile tenere presente che gli intervalli di confidenza del frequentatore richiedono / richiedono una copertura uniforme (esattamente o almeno maggiore di x% per ogni valore di parametro che non ha probabilità zero) e se non lo fanno ce l'hanno - non sono davvero intervalli di confidenza. (Alcuni andrebbero oltre e affermano che devono anche escludere sottoinsiemi pertinenti che cambiano la copertura.)

La copertura bayesiana è di solito definita rilassando quella "su una copertura media" dato che il presupposto precedente risulta esattamente corretto. Gustafson e la Groenlandia (2009) chiamano questi priori onnipotenti e considerano quelli vulnerabili per fornire una valutazione migliore.


1
+1 Non ho mai saputo di questa differenza nelle restrizioni, grazie per averlo sottolineato.
Mehrdad,

3

Se qualcuno dovesse porre una domanda che ha una risposta sia frequentista che bayesiana, sospetto che qualcun altro sarebbe in grado di identificare un'ambiguità nella domanda, rendendola così "non ben formata".

In altre parole, se hai bisogno di una risposta da frequentatore, usa i metodi frequentatore. Se hai bisogno di una risposta bayesiana, usa i metodi bayesiani. Se non sai di cosa hai bisogno, potresti non aver definito la domanda in modo inequivocabile.

Tuttavia, nel mondo reale ci sono spesso diversi modi per definire un problema o porre una domanda. A volte non è chiaro quale di questi modi sia preferibile. Ciò è particolarmente comune quando il proprio cliente è statisticamente ingenuo. Altre volte è molto più difficile rispondere a una domanda rispetto a un'altra. In questi casi si va spesso con il più semplice mentre si cerca di assicurarsi che i suoi clienti siano d'accordo esattamente con quale domanda si pone o quale problema sta risolvendo.


3

Consiglio di leggere l'Esercizio 3.15 del libro di testo disponibile gratuitamente Teoria delle informazioni, inferenza e algoritmi di apprendimento di MacKay.

Quando è stata lanciata sul bordo 250 volte, una moneta belga da un euro è salita di testa 140 volte e segna 110. "Mi sembra molto sospetto", ha affermato Barry Blight, docente di statistica alla London School of Economics. "Se la moneta fosse imparziale, la possibilità di ottenere un risultato estremo sarebbe inferiore al 7%". Ma questi dati dimostrano che la moneta è distorta piuttosto che giusta?

p0.076:1

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.