Ragionamento bayesiano e frequentista in un inglese semplice


341

Come descriveresti in parole povere le caratteristiche che distinguono il ragionamento bayesiano da quello frequentista?


Questa domanda sul trarre conclusioni su un singolo giocatore di bocce quando hai due set di dati - i risultati di altri giocatori e i risultati del nuovo giocatore, è un buon esempio spontaneo della differenza che la mia risposta cerca di affrontare in un inglese semplice.
Peter Ellis,

4
Forse alcune di voi brave persone potrebbero anche dare una risposta a una domanda sulle interpretazioni bayesiane e frequentiste che viene posta su filosofia.stackexchange.com .
Drux,

Risposte:


198

Ecco come spiegherei la differenza di base a mia nonna:

Ho smarrito il telefono da qualche parte in casa. Posso localizzare il telefono sulla base dello strumento per localizzare il telefono e quando premo il localizzatore del telefono il telefono inizia a emettere un segnale acustico.

Problema: quale area della mia casa dovrei cercare?

Ragionamento frequentista

Sento il segnale acustico del telefono. Ho anche un modello mentale che mi aiuta a identificare l'area da cui proviene il suono. Pertanto, sentendo il segnale acustico, desidero l'area della mia casa che devo cercare per localizzare il telefono.

Ragionamento bayesiano

Sento il segnale acustico del telefono. Ora, a parte un modello mentale che mi aiuta a identificare l'area da cui proviene il suono, conosco anche le posizioni in cui ho smarrito il telefono in passato. Quindi, unisco le mie inferenze usando i segnali acustici e le mie informazioni precedenti sulle posizioni in cui ho smarrito il telefono in passato per identificare un'area che devo cercare per localizzare il telefono.


11
Mi piace l'analogia. Lo troverei molto utile se ci fosse una domanda definita (basata su un set di dati) in cui una risposta è stata derivata usando il ragionamento frequentista e una risposta è stata derivata usando Bayesiano - preferibilmente con lo script R per gestire entrambi i ragionamenti. Sto chiedendo troppo?
Farrel,

15
La cosa più semplice che mi viene in mente è quella di lanciare una moneta n volte e stimare la probabilità di una testa (denotata con p). Supponiamo di osservare k teste. Quindi la probabilità di ottenere k teste è: P (k teste in n prove) = (n, k) p ^ k (1-p) ^ (nk) L'inferenza del frequentista massimizzerebbe quanto sopra per arrivare a una stima di p = k / n. Bayesian direbbe: Ehi, so che p ~ Beta (1,1) (che equivale a supporre che p sia uniforme su [0,1]). Quindi, l'inferenza aggiornata sarebbe: p ~ Beta (1 + k, 1 + nk) e quindi la stima bayesiana di p sarebbe p = 1 + k / (2 + n) Non conosco R, scusa.

41
Va sottolineato che, dal punto di vista dei frequentisti, non vi è alcun motivo per cui non è possibile incorporare le conoscenze precedenti nel modello. In questo senso, la visione frequentista è più semplice, hai solo un modello e alcuni dati. Non è necessario separare le informazioni precedenti dal modello.
Robby McKilliam,

1
@ user28 Come commento al tuo commento, se , il frequentatore stimerebbe (rispettivamente ) vedendo un risultato di teste (rispettivamente teste), cioè la moneta è a due teste o a due code. Le stime bayesiane rispettivamente e prevedono la possibilità che si tratti di una moneta un po 'meno distorta. n=3p=0p=1k=0k=31/54/5
Dilip Sarwate,

3
@ BYS2 Il linguaggio di programmazione chiamato R.
user1205901

104

Lingua saldamente nella guancia:

Un bayesiano definisce una "probabilità" esattamente nello stesso modo della maggior parte dei non statistici - vale a dire un'indicazione della plausibilità di una proposizione o di una situazione. Se gli fai una domanda, ti darà una risposta diretta assegnando le probabilità che descrivono le plausibilità dei possibili risultati per la situazione particolare (e dichiarano le sue assunzioni precedenti).

Un frequentista è qualcuno che crede che le probabilità rappresentino frequenze a lungo termine con cui si verificano eventi; se necessario, inventerà una popolazione fittizia dalla quale la tua situazione particolare potrebbe essere considerata un campione casuale in modo da poter parlare in modo significativo delle frequenze a lungo termine. Se gli fai una domanda su una situazione particolare, non darà una risposta diretta, ma farà una dichiarazione su questa popolazione (forse immaginaria). Molti statistici non frequentisti saranno facilmente confusi dalla risposta e la interpreteranno come probabilità bayesiana sulla situazione particolare.

Tuttavia, è importante notare che la maggior parte dei metodi frequentisti ha un equivalente bayesiano che nella maggior parte dei casi darà essenzialmente lo stesso risultato, la differenza è in gran parte una questione di filosofia, e in pratica si tratta di "cavalli per i corsi".

Come avrai intuito, sono un bayesiano e un ingegnere. ; O)


36
Come non esperto, penso che la chiave di tutto il dibattito sia che le persone ragionano come i bayesiani. Devi essere addestrato a pensare come un frequentatore, e anche allora è facile scivolare e ragionare o presentare il tuo ragionamento come se fosse bayesiano. "C'è una probabilità del 95% che il valore rientri in questo intervallo di confidenza." È stato detto abbastanza.
Wayne,

8
La chiave è anche quello di pensare a che tipo di lobbying ha le statistiche del 20 ° secolo chiamato "classica", mentre le statistiche che Laplace e Gauss hanno iniziato ad utilizzare nel 19 ° secolo non sono ...
GWR

3
Forse ho svolto il lavoro di frequentatore troppo a lungo, ma non sono così sicuro che il punto di vista bayesiano sia sempre intuitivo. Ad esempio, supponiamo che io sia interessato a un parametro di interesse nel mondo reale, come l'altezza media di una popolazione. Se ti dico "esiste una probabilità del 95% del parametro di interesse nel mio intervallo credibile", e quindi rispondo con una domanda di "Se abbiamo creato 100 di tali intervalli per parametri diversi, quale proporzione di essi ci aspetteremmo di contenere i valori reali del parametro? ", il fatto che la risposta non sia 95 deve confondere alcune persone.
Cliff AB,

4
@CliffAB ma perché dovresti porre la seconda domanda? Il punto è che sono domande diverse, quindi non sorprende che abbiano risposte diverse. Il Baysian può rispondere ad entrambe le domande, ma la risposta potrebbe essere diversa (il che mi sembra ragionevole). Il frequentista può solo rispondere a una delle domande (a causa della definizione restrittiva di probabilità) e quindi (implicitamente) usa la stessa risposta per entrambe le domande, che è ciò che causa i problemi. Un intervallo credibile non è un intervallo di confidenza, ma un bayesiano può costruire sia un intervallo credibile che un intervallo di confidenza.
Dikran Marsupial,

4
Il mio commento era in risposta a Wayne; l'idea che le persone "naturalmente" pensino in un contesto bayesiano, poiché è più facile interpretare un intervallo credibile. Il mio punto è che mentre è più semplice costruire la giusta interpretazione di un intervallo credibile (cioè meno di una minestra di parole), penso che il non statistico abbia la stessa probabilità di essere confuso su cosa significhi davvero .
Cliff AB,

64

Molto rozzamente direi che:

Frequentista: il campionamento è infinito e le regole di decisione possono essere precise. I dati sono un campione casuale ripetibile - c'è una frequenza. I parametri sottostanti sono fissi, cioè rimangono costanti durante questo processo di campionamento ripetibile.

Bayesiano: quantità sconosciute vengono trattate probabilisticamente e lo stato del mondo può sempre essere aggiornato. I dati sono osservati dal campione realizzato. I parametri sono sconosciuti e descritti probabilisticamente. Sono i dati che sono stati corretti.

C'è un brillante post sul blog che fornisce un esempio approfondito di come un bayesiano e un frequentista affronterebbero lo stesso problema. Perché non rispondere al problema da solo e quindi controllare?

Il problema (tratto dal blog di Panos Ipeirotis):

Hai una moneta che quando lanciata finisce testa con probabilità p e finisce coda con probabilità 1-p. (Il valore di p è sconosciuto.)

Cercando di stimare p, lanci la moneta 100 volte. Finisce per la testa 71 volte.

Quindi devi decidere il seguente evento: "Nei prossimi due lanci avremo due teste di fila".

Scommetti che l'evento accadrà o che non accadrà?


6
Da , lo considererei abbastanza vicino a una scommessa pari da essere preparato ad andare modestamente in entrambi i modi solo per divertimento (e ignorare qualsiasi problema sulla forma del precedente). A volte compro biglietti per assicurazioni e lotterie con probabilità molto peggiori. 0.712=0.5041
Henry,

5
Alla fine di quel post sul blog si dice "invece di usare la distribuzione uniforme come un precedente, possiamo essere ancora più agnostici. In questo caso, possiamo usare la distribuzione Beta (0,0) come un precedente. Tale distribuzione corrisponde nel caso in cui qualsiasi mezzo di distribuzione sia ugualmente probabile. In questo caso, i due approcci, bayesiano e frequentista danno gli stessi risultati ". che tipo di riassume davvero!
TC

13
Il grosso problema di quel post sul blog è che non caratterizza adeguatamente ciò che farebbe un decisore non bayesiano (ma razionale). È poco più di un uomo di paglia.
whuber

1
@tdc: il precedente bayesiano (Jeffreys) è Beta (0,5, 0,5) e alcuni direbbero che è l'unico precedente giustificabile.
Neil G

1
@mcb - preciso.
digitgopher,

42

Supponiamo che un uomo tira un dado a sei facce e abbia esiti 1, 2, 3, 4, 5 o 6. Inoltre, dice che se atterra su un 3, ti darà un libro di testo gratuito.

Quindi informalmente:

Il frequentista direbbe che ogni risultato ha una probabilità pari a 1 su 6 di verificarsi. Considera la probabilità derivata da distribuzioni di frequenza a lungo termine.

Il bayesiano però direbbe che aspetta un secondo, conosco quell'uomo, è David Blaine, un famoso imbroglione! Ho la sensazione che stia facendo qualcosa. Sto per dire che c'è solo l'1% di probabilità che atterri su un 3 MA rivaluterò quella credenza e la cambierò più volte tirerà il dado. Se vedo che gli altri numeri appaiono ugualmente spesso, aumenterò iterativamente la probabilità dall'1% a qualcosa di leggermente più alto, altrimenti lo ridurrò ulteriormente. Considera la probabilità come gradi di credenza in una proposizione.


24
Penso che il frequentatore sottolineerebbe (verbalmente) le sue assunzioni ed eviterebbe di fare qualsiasi previsione utile. Forse direbbe: "Supponendo che il dado sia giusto, ogni risultato ha una probabilità pari a 1 su 6. Si verifica inoltre che se i tiri di dado sono equi e David Blaine lancia il dado 17 volte, c'è solo una probabilità del 5% che non atterrerà mai su 3, quindi un risultato del genere mi farebbe dubitare che il dado sia giusto ".
Thomas Levine,

Quindi la "verosimiglianza" (come in MLE) sarebbe la "probabilità" del frequentatore?
Akababa,

40

Solo un po 'di divertimento ...

Un bayesiano è uno che, vagamente in attesa di un cavallo, e intravede un asino, crede fermamente di aver visto un mulo.

Da questo sito:

http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html

e dallo stesso sito, un bel saggio ...

"Una spiegazione intuitiva del teorema di Bayes"

http://yudkowsky.net/rational/bayes


14
Nel qual caso, il frequentatore non sarebbe colui che conosce il rapporto tra popolazioni di asino, mulo e cavallo, e osservando un branco di muli inizia a calcolare il valore p per sapere se c'è stato un aumento statisticamente significativo nel rapporto di popolazione di muli.
Andrew,

30

Al Bayesiano viene chiesto di fare scommesse, che possono includere qualsiasi cosa da cui la mosca striscia più veloce su un muro verso la quale la medicina salverà la maggior parte delle vite o quali prigionieri dovrebbero andare in prigione. Ha una grande scatola con una maniglia. Sa che se mette assolutamente tutto quello che sa nella scatola, inclusa la sua opinione personale, e gira la maniglia, prenderà la migliore decisione possibile per lui.

Al frequentatore viene chiesto di scrivere rapporti. Ha un grande libro nero di regole. Se la situazione in cui gli viene chiesto di fare una segnalazione è trattata dal suo libro delle regole, può seguire le regole e scrivere una relazione così attentamente formulata che è sbagliata, nel peggiore dei casi, una volta su 100 (o una volta su 20, o una tempo in qualunque sia la specifica del suo rapporto).

Il frequentista sa (perché ha scritto dei resoconti su di esso) che il bayesiano a volte fa scommesse che, nel peggiore dei casi, quando la sua opinione personale è sbagliata, potrebbe andare male. Il frequentatore sa anche (per lo stesso motivo) che se scommette contro il bayesiano ogni volta che si differenzia da lui, allora, nel lungo periodo, perderà.


"nel lungo periodo, perderà" è ambiguo. Suppongo che "lui" sia il bayesiano qui? A lungo termine non sarebbero uguali: il bayesiano potrebbe imparare e cambiare il suo modo di parlare fino a quando non corrisponderà ai fatti reali (ma sconosciuti).
lucidbrot,

26

In parole povere, direi che il ragionamento bayesiano e frequentista si distinguono in due modi diversi per rispondere alla domanda:

Qual è la probabilità?

La maggior parte delle differenze si riduce essenzialmente al modo in cui ognuno risponde a questa domanda, poiché in sostanza definisce il dominio delle valide applicazioni della teoria. Ora non puoi davvero dare una risposta in termini di "inglese semplice", senza generare ulteriori domande. Per me la risposta è (come probabilmente si potrebbe immaginare)

la probabilità è logica

la mia ragione "non inglese semplice" per questo è che il calcolo delle proposizioni è un caso speciale del calcolo delle probabilità, se rappresentiamo la verità per e la falsità per10. Inoltre, il calcolo delle probabilità può essere derivato dal calcolo delle proposizioni. Ciò si conforma più da vicino al ragionamento "bayesiano" - sebbene estenda anche il ragionamento bayesiano nelle applicazioni fornendo principi per assegnare le probabilità, oltre a principi per manipolarle. Naturalmente, questo porta alla domanda di follow-up "cos'è la logica?" per me, la cosa più vicina che potrei dare come risposta a questa domanda è "la logica è il giudizio di buon senso di una persona razionale, con una data serie di presupposti" (che cos'è una persona razionale? ecc. ecc.). La logica ha tutte le stesse caratteristiche del ragionamento bayesiano. Ad esempio, la logica non ti dice cosa assumere o cosa è "assolutamente vero". Ti dice solo come la verità di una proposizione è collegata alla verità di un'altra. Devi sempre fornire un sistema logico con "assiomi" per iniziare le conclusioni. Hanno anche le stesse limitazioni in quanto è possibile ottenere risultati arbitrari da assiomi contraddittori. Ma gli "assiomi" non sono altro che probabilità precedenti che sono state impostate su1 . Per me, rifiutare il ragionamento bayesiano è rifiutare la logica. Perché se accetti la logica, allora perché il ragionamento bayesiano "scorre logicamente dalla logica" (com'è per il semplice inglese: P), devi anche accettare il ragionamento bayesiano.

Per il ragionamento frequentista, abbiamo la risposta:

la probabilità è frequenza

anche se non sono sicuro che "frequenza" sia un semplice termine inglese nel modo in cui viene usato qui - forse "proporzione" è una parola migliore. Volevo aggiungere alla risposta del frequentatore che si ritiene che la probabilità di un evento sia una quantità reale, misurabile (osservabile?), Che esiste indipendentemente dalla persona / oggetto che lo sta calcolando. Ma non potevo farlo in un modo "inglese semplice".

Quindi forse una versione "inglese semplice" di una potrebbe essere la differenza che il ragionamento frequentista è un tentativo di ragionamento da probabilità "assolute", mentre il ragionamento bayesiano è un tentativo di ragionamento da probabilità "relative".

Un'altra differenza è che le basi del frequentista sono più vaghe nel modo in cui traduci il problema del mondo reale nella matematica astratta della teoria. Un buon esempio è l'uso di "variabili casuali" in teoria - hanno una definizione precisa nel mondo astratto della matematica, ma non esiste una procedura inequivocabile che si possa usare per decidere se una certa quantità osservata è o non è un "casuale" variabile".

Il modo di ragionamento bayesiano, la nozione di "variabile casuale" non è necessaria. Una distribuzione di probabilità è assegnata a una quantità perché è sconosciuta , il che significa che non può essere dedotta logicamente dalle informazioni in nostro possesso. Ciò fornisce immediatamente una semplice connessione tra la quantità osservabile e la teoria, poiché "essere sconosciuti" non è ambiguo.

Nell'esempio sopra puoi anche vedere un'ulteriore differenza in questi due modi di pensare: "casuale" vs "sconosciuto". La "casualità" è definita in modo tale che la "casualità" sembra essere una proprietà della quantità effettiva. Al contrario, "essere sconosciuti" dipende da quale persona si sta chiedendo riguardo a tale quantità - quindi è una proprietà dello statistico che esegue l'analisi. Questo dà origine agli aggettivi "oggettivi" contro "soggettivi" spesso associati a ciascuna teoria. È facile dimostrare che la "casualità" non può essere una proprietà di alcuni esempi standard, semplicemente chiedendo a due frequentatori a cui vengono fornite informazioni diverse sulla stessa quantità di decidere se è "casuale". Uno è il solito Urna di Bernoulli: il frequentatore 1 è bendato mentre disegna, mentre il frequentista 2 è in piedi sopra l'urna, osservando il frequentatore 1 estrarre le palline dall'urna. Se la dichiarazione di "casualità" è una proprietà delle palle nell'urna, allora non può dipendere dalla diversa conoscenza del frequentatore 1 e 2 - e quindi i due frequentisti dovrebbero dare la stessa dichiarazione di "casuale" o "non casuale" .


3
Sarei interessato se potessi riscriverlo senza il riferimento al buon senso.
Peter Ellis,

@PeterEllis - Cosa c'è che non va nel senso comune? Lo abbiamo tutti, e di solito è sciocco non usarlo ...
Probislogic

13
È troppo contestato quello che è in realtà e troppo culturalmente specifico. Il "senso comune" è una scorciatoia per qualunque sia il modo sensato percepito di fare le cose in questa cultura particolare (che troppo spesso sembra lontana dall'essere sensibile a un'altra cultura nel tempo e nello spazio), quindi riferirsi ad essa in una definizione evita le domande chiave . È particolarmente inutile come parte di una definizione di logica (e quindi, direi, è il concetto di "persona razionale" in quel particolare contesto - in particolare mentre immagino che la tua definizione di "persona razionale" sia una persona logica chi ha buon senso!)
Peter Ellis,

4
Non può fornirne una, la sua argomentazione è che non esiste una definizione universale , ma solo quelle culturalmente specifiche. Due persone di diversa estrazione culturale (e che includono diversi stili di educazione statistica) avranno probabilmente due diverse comprensioni di ciò che è sensato fare in una data situazione.
naught101,

2
Questa risposta ha pepite di bontà (come va per un inglese semplice?), Ma non credo (come è per essere bayesiano!) Che la seguente affermazione è vera: "Perché se accetti la logica ... devi anche accettare Ragionamento bayesiano ". Ad esempio, se pensi invece di tradurre la teoria astratta della matematica nel mondo reale, scoprirai che l'approccio assiomatico può essere coerente con il ragionamento sia frequentista che bayesiano! Probabilmente, Kolmogorov nel primo caso e, diciamo, Jeffreys nel secondo. In sostanza, è la teoria della probabilità che è la logica; non la sua interpretazione.
Graeme Walsh,

21

In realtà, penso che gran parte della filosofia che circonda il problema sia semplicemente eccezionale. Non si tratta di chiudere il dibattito, ma è un avvertimento. A volte, le questioni pratiche hanno la priorità - fornirò un esempio di seguito.

Inoltre, potresti altrettanto facilmente sostenere che esistono più di due approcci:

  • Neyman-Pearson ("frequentista")
  • Approcci basati sulla verosimiglianza
  • Completamente bayesiano

Un collega anziano mi ha recentemente ricordato che "molte persone nella lingua comune parlano di frequentista e bayesiano. Penso che una distinzione più valida sia basata sulla probabilità e frequentista. Sia la massima verosimiglianza che i metodi bayesiani aderiscono al principio di verosimiglianza, mentre i metodi frequentisti non lo fanno. "

Inizierò con un esempio pratico molto semplice:

Abbiamo un paziente. Il paziente è sano (H) o malato (S). Eseguiremo un test sul paziente e il risultato sarà positivo (+) o negativo (-). Se il paziente è malato, otterrà sempre un risultato positivo. Chiameremo questo il risultato (C) corretto e diremo che o Se il paziente è sano, il test sarà negativo al 95% delle volte, ma lì saranno alcuni falsi positivi. In altri lavori, la probabilità che il test sia corretto, per le persone sane, è del 95%.

P(+|S)=1
P(Correct|S)=1
P(|H)=0.95
P(+|H)=0.05

Quindi, il test è accurato al 100% o accurato al 95%, a seconda che il paziente sia sano o malato. Nel complesso, ciò significa che il test è accurato almeno al 95%.

Fin qui tutto bene. Quelle sono le dichiarazioni che sarebbero fatte da un frequentatore. Queste affermazioni sono abbastanza semplici da capire e sono vere. Non c'è bisogno di confondersi con una "interpretazione frequentista".

Ma le cose diventano interessanti quando provi a cambiare le cose. Dato il risultato del test, cosa puoi imparare sulla salute del paziente? Dato un risultato negativo del test, il paziente è ovviamente sano, poiché non ci sono falsi negativi.

Ma dobbiamo anche considerare il caso in cui il test è positivo. Il test è stato positivo perché il paziente era effettivamente malato o era un falso positivo? Qui divergono il frequentatore e il bayesiano. Tutti saranno d'accordo sul fatto che al momento non è possibile rispondere a questa domanda. Il frequentista rifiuterà di rispondere. Il bayesiano sarà pronto a darti una risposta, ma dovrai dare al bayesiano una prima, ovvero dirgli quale percentuale di pazienti è malata.

Per ricapitolare, le seguenti affermazioni sono vere:

  • Per i pazienti sani, il test è molto accurato.
  • Per i pazienti malati, il test è molto preciso.

Se sei soddisfatto di affermazioni del genere, stai usando interpretazioni frequentiste. Questo potrebbe cambiare da progetto a progetto, a seconda del tipo di problemi che stai riscontrando.

Ma potresti voler fare diverse dichiarazioni e rispondere alla seguente domanda:

  • Per quei pazienti che hanno ottenuto un risultato positivo del test, quanto è accurato il test?

Ciò richiede un approccio precedente e un bayesiano. Si noti inoltre che questa è l'unica domanda di interesse per il medico. Il dottore dirà "So che i pazienti otterranno un risultato positivo o un risultato negativo. Inoltre, ora che il risultato negativo indica che il paziente è sano e può essere rimandato a casa. Gli unici pazienti che mi interessano ora sono quelli che hanno ottenuto un risultato positivo - sono malati? "

Riassumendo: in esempi come questo, il bayesiano concorderà con tutto quanto detto dal frequentatore. Ma il bayesiano sosterrà che le affermazioni del frequentatore, sebbene vere, non sono molto utili; e sosterrà che le domande utili possono essere risolte solo con un precedente.

Un frequentatore considererà a turno ogni possibile valore del parametro (H o S) e chiederà "se il parametro è uguale a questo valore, qual è la probabilità che il mio test sia corretto?"

Un bayesiano considererà invece ogni possibile valore osservato (+ o -) a sua volta e chiederà "Se immagino di aver appena osservato quel valore, cosa mi dice sulla probabilità condizionale di H-contro-S?"


1
Vuoi dire che For sick patients, the test is NOT very accurate.hai dimenticato il NOT?
agstudy,

1
È molto preciso in entrambi i casi, quindi no non ho dimenticato una parola. Per le persone sane, il risultato sarà corretto (cioè "negativo") il 95% delle volte. E per i malati, il risultato sarà corretto (cioè "positivo") il 95% delle volte.
Aaron McDaid il

Penso che la "debolezza" nella massima verosimiglianza sia che presuppone un'uniforme prima dei dati, mentre "Bayesiano completo" è più flessibile in quale prioritario puoi scegliere.
Joe Z.

Per completare l'esempio, supponiamo che lo 0,1% della popolazione sia malato di malattia D per cui stiamo testando: questo non è il nostro precedente. Più probabilmente, qualcosa come il 30% dei pazienti che vengono dal medico e hanno sintomi che corrispondono a D in realtà hanno D (questo potrebbe essere più o meno a seconda dei dettagli come la frequenza con cui una malattia diversa presenta gli stessi sintomi). Pertanto, il 70% di coloro che si sottopongono al test sono sani, il 66,5% ottiene un risultato negativo e il 30% / 33,5% è malato. Quindi, dato un risultato positivo, la nostra probabilità posteriore che un paziente sia malato è dell'89,6%. Prossimo enigma: come sapevamo che il 70% dei partecipanti al test aveva D?
Qwertie,

7

Le statistiche bayesiane e frequentiste sono compatibili in quanto possono essere intese come due casi limitanti di valutazione della probabilità di eventi futuri basati su eventi passati e di un modello ipotizzato, se si ammette che nel limite di un numero molto elevato di osservazioni, nessuna incertezza circa il sistema rimane e che in questo senso un numero molto elevato di osservazioni equivale a conoscere i parametri del modello.

Supponiamo di aver fatto alcune osservazioni, ad esempio, il risultato di 10 lanci di monete. Nelle statistiche bayesiane, inizi da ciò che hai osservato e quindi valuti la probabilità di osservazioni o parametri del modello futuri. Nelle statistiche del frequentista, si parte da un'idea (ipotesi) di ciò che è vero ipotizzando scenari di un gran numero di osservazioni fatte, ad esempio, la moneta è imparziale e dà il 50% di heads-up, se la si lancia molte volte. Sulla base di questi scenari di un gran numero di osservazioni (= ipotesi), si valuta la frequenza di fare osservazioni come quella che si è fatto, vale a dire, la frequenza di diversi risultati di 10 lanci di monete. È solo allora che prendi il tuo esito effettivo, lo confronti con la frequenza dei possibili esiti e decidi se il risultato appartiene a quelli che dovrebbero verificarsi ad alta frequenza. In questo caso, concludi che l'osservazione fatta non contraddice i tuoi scenari (= ipotesi). Altrimenti, concludi che l'osservazione fatta è incompatibile con i tuoi scenari e respingi l'ipotesi.

Quindi le statistiche bayesiane partono da quanto osservato e valutano possibili esiti futuri. Le statistiche del frequentista iniziano con un esperimento astratto di ciò che verrebbe osservato se si assumesse qualcosa, e solo allora confronta i risultati dell'esperimento astratto con ciò che è stato effettivamente osservato. Altrimenti i due approcci sono compatibili. Entrambi valutano la probabilità di osservazioni future sulla base di alcune osservazioni fatte o ipotizzate.

Ho iniziato a scriverlo in un modo più formale:

Posizionare l'inferenza bayesiana come una particolare applicazione dell'inferenza frequentista e viceversa. figshare.

http://dx.doi.org/10.6084/m9.figshare.867707

Il manoscritto è nuovo. Se ti capita di leggerlo e hai commenti, per favore fatemelo sapere.


6

Direi che guardano alla probabilità in diversi modi. Il bayesiano è soggettivo e utilizza credenze a priori per definire una distribuzione di probabilità precedente sui possibili valori dei parametri sconosciuti. Quindi fa affidamento su una teoria della probabilità come quella di deFinetti. Il frequentista vede la probabilità come qualcosa che ha a che fare con una frequenza limite basata su una proporzione osservata. Ciò è in linea con la teoria della probabilità sviluppata da Kolmogorov e von Mises.
Un frequentatore fa inferenza parametrica usando solo la funzione di verosimiglianza. Un bayesiano lo prende e si moltiplica per un precedente e lo normalizza per ottenere la distribuzione posteriore che usa per l'inferenza.


4
+1 Buona risposta, ma va sottolineato che l'approccio bayesiano e l'approccio frequenza differiscono rispetto alla loro interpretazione della probabilità. Kolmogorov, d'altra parte, fornisce una base assiomatica per la teoria della probabilità, che non richiede un'interpretazione (!) Come quelle impiegate dal bayesiano o dal frequentatore. In un certo senso, il sistema assiomatico ha una vita propria! Dai soli sei assiomi di Kolmogorov, non credo sia possibile dire che il suo sistema assiomatico sia bayesiano o frequentista e, in effetti, potrebbe essere coerente con entrambi.
Graeme Walsh,

1

Il modo in cui rispondo a questa domanda è che i frequentatori confrontano i dati che vedono con quelli che si aspettavano. Cioè, hanno un modello mentale sulla frequenza con cui qualcosa dovrebbe accadere, quindi vedono i dati e quanto spesso è accaduto. cioè quanto sono probabili i dati che hanno visto dato il modello che hanno scelto.

I bayesiani , d'altra parte, combinano i loro modelli mentali. Cioè, hanno un modello basato sulle loro esperienze precedenti che dice loro come pensano che dovrebbero apparire i dati, e poi li combinano con i dati che osservano per stabilirsi su una credenza `` posteriore ''. cioè, trovano la probabilità che il modello che cercano di scegliere sia valido dati i dati che hanno osservato.


-2

Frequentista: il vero stato della natura è. Se faccio abitualmente analisi come questa, il 95% delle mie risposte sarà corretto.

Bayesiano: c'è una probabilità del 95% che la vera risposta sia ... Baso questo su una combinazione dei dati che mi hai dato e delle nostre precedenti ipotesi su quale sia la verità.


-3

Frequentista: scommesse sui dadi. Solo il valore dei dadi deciderà il risultato: vincerai la tua scommessa o no. A seconda del caso da solo.

Bayesian: giocare a poker Texas Hold'em. Sei l'unico che vede le tue due carte. Hai qualche conoscenza degli altri giocatori sul tavolo. Devi regolare la tua probabilità di vincere al flop, turn e river e possibilmente in base a quali giocatori rimangono. Bluffano spesso? Sono giocatori aggressivi o passivi? Tutto questo deciderà cosa fai. Non è solo la probabilità di quelle prime due carte che hai, che deciderà se vincere o no.

Giocare a poker frequentista significherebbe che ogni giocatore mostrerebbe le sue mani all'inizio e quindi scommettere o passare prima che vengano mostrate le carte flop, turn e river. Ora dipende solo di nuovo dal caso che tu vinca o meno.


-5

Di ', se hai avuto mal di testa e vai dal dottore. Supponiamo che, nella serie di decisioni del medico, ci siano due cause per un mal di testa, # 1 per il tumore al cervello (una causa principale che crea mal di testa il 99% delle volte) e # 2 freddo (una causa che può creare mal di testa in pochissimi pazienti) .

Quindi sarebbe una decisione del medico basata sull'approccio del frequentista, hai un tumore al cervello.

La decisione dei medici basata sull'approccio bayesiano ti direbbe che hai il raffreddore (anche se solo l'1% del raffreddore provoca mal di testa)


1
(-1) Non è chiaro quale sia la differenza tra "Doc frequentista" e "Doc bayesiano". Non vedo alcun motivo per cui il doc Frequentist ignori i dati sul mal di testa che causa freddo. Il dottore bayesiano non sembra usare il teorema o i priori di Bayes comunque, quindi non vedo come sta bayesiano?
Tim

Troppo plausibile per essere un'analogia utile o persino divertente.
Nick Cox,

-6

Un gatto maschio e una femmina sono raccolti in una camera d'acciaio, insieme a cibo e acqua sufficienti per 70 giorni.

Un Frequentista direbbe che il periodo medio di gestazione per i felini è di 66 giorni, la femmina era in calore quando i gatti venivano valutati e una volta in calore si accoppiava ripetutamente per 4-7 giorni. Dato che probabilmente c'erano molti atti di propagazione e abbastanza tempo successivo per la gestazione, le probabilità sono, quando la scatola viene aperta il giorno 70, c'è una cucciolata di gattini appena nati.

Un bayesiano direbbe, ho sentito alcuni seri Marvin Gaye provenire dalla scatola il primo giorno e poi stamattina ho sentito molti suoni da gattino provenire dalla scatola. Quindi, senza sapere molto sulla riproduzione dei gatti, le probabilità sono che quando la scatola viene aperta il giorno 70, c'è una cucciolata di gattini appena nati.


Il modo in cui l'ho scritto, in particolare con il bayesiano che non sapeva molto sulla riproduzione dei gatti, all'inizio solo il frequentatore avrebbe scommesso sul fatto che c'erano dei cuccioli. I punti rilevanti del mio esempio molto rozzo erano principalmente che il frequentista aveva fatto la sua previsione basata sui dati all'inizio, poi si è seduto senza incorporare nuovi dati supplementari, mentre il bayesiano non aveva molti dati per cominciare, ma ha continuato a incorporare dati pertinenti non appena disponibili.
Un leone,

3
... e perché un non bayesiano non dovrebbe avvalersi anche dei dati aggiuntivi?
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.