Mi è stata posta questa domanda con in un'intervista. C'è una risposta "corretta"?
Supponiamo che i tiri siano iid e la probabilità di testa sia . La distribuzione del numero di teste in 400 lanci dovrebbe quindi essere vicina alla Normale (200, 10 ^ 2), in modo che 220 teste siano 2 deviazioni standard dalla media. La probabilità di osservare un tale risultato (cioè più 2 DS di distanza dalla media in entrambe le direzioni) è leggermente inferiore al 5%.
L'intervistatore mi disse, in sostanza, "se osservassi qualcosa> = 2 DS dalla media, concludo che sta succedendo qualcos'altro. Scommetterei che la moneta sia giusta". È ragionevole - dopo tutto, è quello che fanno la maggior parte dei test di ipotesi. Ma è la fine della storia? Per l'intervistatore che sembrava essere la risposta "corretta". Quello che sto chiedendo qui è se qualche sfumatura è giustificata.
Non ho potuto fare a meno di sottolineare che decidere che la moneta non è giusta è una conclusione bizzarra in questo contesto di lancio delle monete. Ho ragione a dirlo? Proverò a spiegare di seguito.
Prima di tutto, io - e presumo anche la maggior parte delle persone - ho un forte precedente sulle monete: è molto probabile che siano giuste. Ovviamente ciò dipende da cosa intendiamo per equo - una possibilità sarebbe quella di definire "equo" come "avere una probabilità di teste" vicine "a 0,5, diciamo tra 0,49 e 0,51".
(Si potrebbe anche definire 'fiera' nel senso che la probabilità di teste è esattamente 0,50, in questo caso avere una moneta perfettamente giusto ora sembra piuttosto un probabile.)
Il tuo precedente potrebbe dipendere non solo dalle tue convinzioni generali sulle monete, ma anche dal contesto. Se hai estratto la moneta dalla tua tasca, potresti essere praticamente sicuro che sia giusto; se il tuo amico mago lo estraeva dal suo, il tuo priore potrebbe dare più peso alle monete a doppia testa.
In ogni caso, è facile trovare ragionevoli priori che (i) danno una grande probabilità alla moneta di essere equa e (ii) portano il tuo posteriore ad essere abbastanza simile, anche dopo aver osservato 220 teste. Concluderesti quindi che la moneta era molto probabile che fosse equa, nonostante osservassi un risultato di 2 SD dalla media.
In effetti, potresti anche costruire esempi in cui l'osservazione di 220 teste in 400 lanci fa sì che il tuo posteriore ponga più peso sulla moneta essendo equa, ad esempio se tutte le monete ingiuste hanno una probabilità di teste in .
Qualcuno può fare luce su questo per me?
Dopo aver scritto questa domanda, mi sono ricordato di aver già sentito parlare di questa situazione generale, non è forse il "paradosso" di Lindley ?
Whuber ha inserito un link molto interessante nei commenti: You Can Load a Die, Ma You Can't Bias a Coin . Da pagina 3:
Non ha senso dire che la moneta ha una probabilità p di teste, perché può essere completamente determinata dal modo in cui viene lanciata, a meno che non sia lanciata in alto nell'aria con una rapida rotazione e catturata nell'aria con nessun rimbalzo, nel qual caso p = 1/2.
Abbastanza bello! Questo si lega alla mia domanda in modo interessante: supponiamo di sapere che la moneta viene "lanciata in alto in aria con una rapida rotazione e catturata in aria senza rimbalzare". Quindi non dovremmo assolutamente rifiutare l'ipotesi che la moneta sia giusta (dove "giusto" ora significa "avere p = 1/2 quando lanciato nel modo sopra descritto"), perché abbiamo effettivamente un precedente che mette tutte le probabilità sul la moneta è giusta. Forse questo giustifica in una certa misura il motivo per cui mi sento a disagio nel rifiutare il nulla dopo aver osservato 220 teste.