Osserva k teste da n lanci. La moneta è giusta?


13

Mi è stata posta questa domanda con in un'intervista. C'è una risposta "corretta"?(n,k)=(400,220)

Supponiamo che i tiri siano iid e la probabilità di testa sia . La distribuzione del numero di teste in 400 lanci dovrebbe quindi essere vicina alla Normale (200, 10 ^ 2), in modo che 220 teste siano 2 deviazioni standard dalla media. La probabilità di osservare un tale risultato (cioè più 2 DS di distanza dalla media in entrambe le direzioni) è leggermente inferiore al 5%.p=0.5

L'intervistatore mi disse, in sostanza, "se osservassi qualcosa> = 2 DS dalla media, concludo che sta succedendo qualcos'altro. Scommetterei che la moneta sia giusta". È ragionevole - dopo tutto, è quello che fanno la maggior parte dei test di ipotesi. Ma è la fine della storia? Per l'intervistatore che sembrava essere la risposta "corretta". Quello che sto chiedendo qui è se qualche sfumatura è giustificata.

Non ho potuto fare a meno di sottolineare che decidere che la moneta non è giusta è una conclusione bizzarra in questo contesto di lancio delle monete. Ho ragione a dirlo? Proverò a spiegare di seguito.

Prima di tutto, io - e presumo anche la maggior parte delle persone - ho un forte precedente sulle monete: è molto probabile che siano giuste. Ovviamente ciò dipende da cosa intendiamo per equo - una possibilità sarebbe quella di definire "equo" come "avere una probabilità di teste" vicine "a 0,5, diciamo tra 0,49 e 0,51".

(Si potrebbe anche definire 'fiera' nel senso che la probabilità di teste è esattamente 0,50, in questo caso avere una moneta perfettamente giusto ora sembra piuttosto un probabile.)

Il tuo precedente potrebbe dipendere non solo dalle tue convinzioni generali sulle monete, ma anche dal contesto. Se hai estratto la moneta dalla tua tasca, potresti essere praticamente sicuro che sia giusto; se il tuo amico mago lo estraeva dal suo, il tuo priore potrebbe dare più peso alle monete a doppia testa.

In ogni caso, è facile trovare ragionevoli priori che (i) danno una grande probabilità alla moneta di essere equa e (ii) portano il tuo posteriore ad essere abbastanza simile, anche dopo aver osservato 220 teste. Concluderesti quindi che la moneta era molto probabile che fosse equa, nonostante osservassi un risultato di 2 SD dalla media.

In effetti, potresti anche costruire esempi in cui l'osservazione di 220 teste in 400 lanci fa sì che il tuo posteriore ponga più peso sulla moneta essendo equa, ad esempio se tutte le monete ingiuste hanno una probabilità di teste in .{0,1}

Qualcuno può fare luce su questo per me?


Dopo aver scritto questa domanda, mi sono ricordato di aver già sentito parlare di questa situazione generale, non è forse il "paradosso" di Lindley ?

Whuber ha inserito un link molto interessante nei commenti: You Can Load a Die, Ma You Can't Bias a Coin . Da pagina 3:

Non ha senso dire che la moneta ha una probabilità p di teste, perché può essere completamente determinata dal modo in cui viene lanciata, a meno che non sia lanciata in alto nell'aria con una rapida rotazione e catturata nell'aria con nessun rimbalzo, nel qual caso p = 1/2.

Abbastanza bello! Questo si lega alla mia domanda in modo interessante: supponiamo di sapere che la moneta viene "lanciata in alto in aria con una rapida rotazione e catturata in aria senza rimbalzare". Quindi non dovremmo assolutamente rifiutare l'ipotesi che la moneta sia giusta (dove "giusto" ora significa "avere p = 1/2 quando lanciato nel modo sopra descritto"), perché abbiamo effettivamente un precedente che mette tutte le probabilità sul la moneta è giusta. Forse questo giustifica in una certa misura il motivo per cui mi sento a disagio nel rifiutare il nulla dopo aver osservato 220 teste.


1
Qualche parte della tua domanda cambierebbe se interpretassi la "moneta" come metafora di un processo binario di cui non avevi alcuna conoscenza precedente?
whuber

1
@whuber Questa è una buona domanda. Penso che in quel caso sarei molto più disposto a scegliere "rifiutare quando p <= 0,05", anche se non sono del tutto sicuro di come giustificarlo.
Adrian,

Un altro problema che mi preoccupa è che la persona che ha posto la domanda era interessata all'ipotesi che p = 0,50 esattamente. Ma se pensi che p sia distribuito continuamente, questo avrà probabilità zero, indipendentemente da ciò che osservi. Mi sembra molto più significativo fare affermazioni su p appartenenti ad un certo intervallo. Questo sarebbe un problema nella situazione in cui non avevo alcuna conoscenza preliminare e ho deciso di utilizzare un uniforme prima, per esempio.
Adrian,

3
p

1
@Adrian DJC MacKay discute questo esatto problema (con n = 250, k = 140) nel suo libro di testo gratuito a questo link: inference.phy.cam.ac.uk/itprnn/book.pdf (p63.) Potrebbe essere interessante leggi cosa dice. Raggiunge una conclusione simile a te.
Flounderer,

Risposte:


4

Il modo bayesiano standard per risolvere questo problema (senza approssimazioni normali) è di dichiarare esplicitamente il tuo precedente, combinarlo con la tua probabilità, che è distribuita in beta. Quindi integrare la parte posteriore di circa il 50%, diciamo due deviazioni standard o dal 49% al 51% o qualsiasi altra cosa tu voglia.

Se la tua precedente convinzione è continua su [0,1] - ad es. Beta (100,100) (questa mette molta massa su monete approssimativamente giuste) - allora la probabilità che la moneta sia giusta è zero poiché anche la probabilità è continua [0 , 1].

Anche se la probabilità che la moneta sia giusta è zero, di solito puoi rispondere a qualsiasi domanda a cui avresti risposto con la parte posteriore rispetto al bias. Ad esempio, qual è il vantaggio del casinò data la distribuzione posteriore sulle probabilità delle monete.


1
0.49<p<0.5199%pBeta(8300,8300)
P(p(0.49,0.51))=0.99003.
p|dataBeta(8300+220,8300+180)
P(p(0.49,0.51)|data)=0.9886.

2

Diciamo per la distribuzione di Bernoulli, in questo caso il lancio di una moneta.

B(n=400,p=0.5)N(μ=200,σ2=100)

k95%B(n=400,p=0.5)pB(n=400,p=0.5,k=220)

p=0.5π(p=0.5)=0.5π(p0.5)=0.5

π(0.49p0.51)=0.9π(p<0.49p>0.51)=0.1p

P(0.49p0.51|k=220)

pN(μ=0.5,σ2=0.25)σ2=0.1

pf(p|k=220)


La mia reputazione non mi basta per scrivere un commento sotto la domanda. Invece scriverò qui qualcosa riguardante You Can't Bias a Coin . @Adrian

Ecco cosa abbiamo

  1. B(n=400,k=220,p=θ)
  2. Lo studio teorico ed sperimentale You Can't Bias a Coin

Ecco la nostra ipotesi

H0:θ^=0.5

H1

Ecco il nostro risultato

  1. H0
  2. H1

pH0H1

Altrimenti qui creiamo un doppio standard per il test delle ipotesi. Non possiamo accettare l'ipotesi che il lancio della moneta sia corretto e che i dati dell'esperimento siano registrati correttamente .


Non ha senso dire che la moneta ha una probabilità p di teste

Abbiamo i risultati dell'esperimento per sostenere questa ipotesi.

pN(μ=0.5,σ2)

σs


1
Grazie Zhang. Un piccolo nit: se volessi usare la distribuzione normale per il tuo precedente rispetto alla probabilità delle teste, direi che dovresti troncarla in modo che p risieda in [0, 1].
Adrian,

Naturalmente ci sono molte distribuzioni precedenti ragionevoli e corrispondenti posteriori. Il vero punto della mia domanda è più generale: decidere che la moneta non è giusta mi sembra una conclusione bizzarra in questo contesto di lancio delle monete. Cosa ne pensi - e perché?
Adrian,

Un precedente conveniente qui sarebbe la distribuzione Beta, poiché è coniugata con la probabilità binomiale. Ma ancora una volta, la vera spinta della mia domanda è più generale del precedente specifico.
Adrian,

π(p=0.5)pU(0,1)E(p)f(p|k=220)p=0.5E(p). E accettiamo facilmente l'ipotesi che la moneta non sia giusta. Soprattutto in questo caso, non troverai che decidere la moneta come non giusta sia una conclusione bizzarra.
Zhang Tschao,

@ user777 La distribuzione normale appare due volte nella risposta di Zhang, prima come approssimazione al binomio (grande), e seconda come un precedente per la probabilità delle teste (quando dice "il precedente è una distribuzione normale p ~ N"). Zhang - la tua modifica sul fatto che Null sia "la moneta è giusta e i dati sono stati registrati correttamente" è interessante, grazie per averla pubblicata.
Adrian,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.