John Kerrich Coin-flip Data


12

Qualcuno può suggerire dove ottenere i risultati dei 10.000 gettoni (cioè di tutte le 10.000 teste e code) eseguiti da John Kerrich durante la Seconda Guerra Mondiale?


1
Dato che all'epoca era rinchiuso in una prigione nazista, mi chiedo se avesse abbastanza carta per registrare tutti i risultati di 10k o se avesse effettivamente solo scritto i valori di riepilogo.
Corone,

6
I risultati di @Corone 10K potrebbero essere facilmente registrati su un foglio di carta standard usando, per esempio, un punto e un codice a barre (come in ||||..|....||.|..||.ecc.). Questo può essere compresso usando (per esempio) esadecimale. Nell'esempio precedente, lasciando |1 ed .essere 0, la rappresentazione esadecimale è f21a6. Scrivendo caratteri piccoli ma visibili posso facilmente inserire 50 di questi caratteri in una riga di scrittura e 50 righe su un foglio, rappresentando così una sequenza di risultati 50 * 50 * 4 = 10K.
whuber

2
@whuber haha, sì, ho iniziato a meditare su cose simili dopo il mio commento. Sono dubbioso che nell'era pre-computer sarebbe venuto in mente esadecimale come adesso, anche se l'ottale ti darebbe comunque una possibilità. Comunque ci ho provato e punti e trattini da solo avrei potuto ottenere più di 100 su un foglio, quindi se avesse usato entrambi i lati 10K sarebbe quasi perfetto. Forse è per questo che si è fermato a 10K!
Corone,

Una prigione nazista, sì, ma in Danimarca non era un campo di sterminio ...
kjetil b halvorsen

@kjetilbhalvorsen - in realtà un campo di prigionia danese a Hald con guardie danesi ecc. per proteggere gli internati dai tedeschi
Henry

Risposte:


13

Non avevo mai sentito parlare di Kerrich prima ... che storia bizzarra. La scansione del libro di Google (condivisa da reftt) di "Un'introduzione sperimentale alla teoria della probabilità" non sembra includere il corpo del testo. Sentendomi un po 'vecchio stile, ho controllato una copia dell'edizione del 1950 dalla biblioteca.

Ho scannerizzato alcune pagine che ho trovato interessanti. Le pagine descrivono le sue condizioni di prova, i dati dei primi lanci di monete 2000 e i dati dei primi 500 di una serie di 5000 esperimenti di urna ugualmente non plausibili (con 2 palline da ping pong rosse e 2 verdi).


Il riconoscimento del testo (e alcune operazioni di pulizia) usando Mathematica 9 fornisce questa sequenza di 2000 code (0) e teste (1) dalla Tabella 1. Il conteggio delle teste di 1014 è uno in più di 502 + 511 = 1013 nella Tabella 2, quindi il riconoscimento era imperfetto, ma sembra piuttosto buono - almeno ha il giusto numero di personaggi! (I lettori con gli occhi acuti sono invitati a correggerlo.)

Ecco un riepilogo grafico di questa passeggiata casuale, seguito dai dati stessi. La differenza accumulata tra i conteggi di testa e coda procede da sinistra a destra, coprendo tutti i 2000 risultati.

figura

00011101001111101000110101111000100111001000001110
00101010100100001001100010000111010100010000101101
01110100001101001010000011111011111001101100101011
01010000011000111001111101101010110100110110110110
01111100001110110001010010000010100111111011101011
10001100011000110001100110100100001000011101111000
11111110000000001101011010011111011110010010101100
11101101110010000010001100101100111110100111100010
00001001101011101010110011111011001000001101011111
11010001111110010111111001110011111111010000100000
00001111100101010111100001110111001000110100001111
11000101001111111101101110110111011010010110110011
01010011011111110010111000111101111111000001001001
01001110111011011011111100000101010101010101001001
11101101110011100000001001101010011001000100001100
10111100010011010110110111001101001010100000010000
00001011001101011011111000101100101000011100110011
11100101011010000110001001100010010001100100001001
01000011100000011101101111001110011010101101001011
01000001110110100010001110010011100001010000000010
10010001011000010010100011111101101111010101010000
01100010100000100000000010000001100100011011101010
11011000110111010110010010111000101101101010110110
00001011011101010101000011100111000110100111011101
10001101110000010011110001110100001010000111110100
00111111111111010101001001100010111100101010001111
11000110101010011010010111110000111011110110011001
11111010000011101010111101101011100001000101101001
10011010000101111101111010110011011110000010110010
00110110101111101011100101001101100100011000011000
01010011000110100111010000011001100011101011100001
11010111011110101101101111001111011100011011010000
01011110100111011001001110001111011000011110011111
01101011101110011011100011001111001011101010010010
10100011010111011000111110000011000000010011101011
10001011101000101111110111000001111111011000000010
10111111011100010000110000110001111101001110110000
00001111011100011101010001011000110111010001110111
10000010000110100000101000010101000101100010111100
00101110010111010010110010110100011000001110000111

3
Prego. Ho sovrapposto una trama di questi dati sull'immagine acquisita, sperando che ciò rendesse ovvie eventuali discrepanze, ma non riesco a trovare alcuna differenza. O non ci sono errori e Kerrich ha contato male o semplicemente non riesco a trovare l'errore, ma in ogni caso i dati pubblicati qui sono un accurato rendering del testo della sua Tabella 1.
whuber

4

Questa presentazione mostra i dati per gli intervalli di lancio impostati. Fa anche riferimento alla fonte principale di Kerrich.


2
La fonte dei dati (di riepilogo) in quella presentazione è Freedman, Pisani e Purves Statistics (qualsiasi edizione). È, tuttavia, solo un riepilogo, non un resoconto di tutti i risultati richiesti qui. Kerrich pubblicò i suoi risultati nel 1946 in un piccolo libro; Google l'ha digitalizzato .
whuber

Come ho detto, ha dati per "intervalli di tiri" e la presentazione fa riferimento alla monografia di Kerrich dove ha pubblicato i suoi risultati. Non so se Kerrich abbia pubblicato la sua lista di ogni singolo lancio. Ho pensato che questo fosse almeno più utile della semplice proporzione complessiva.

@whuber: sì, quella era la monografia citata nella presentazione. sembra avere disponibilità limitata. qualcuno ha trovato un pdf?

2

C'è un altro riferimento di Kerrich nel libro "Incontri di possibilità: un primo corso in analisi dei dati e inferenza" di Chris Wild e George Seber che dice nel capitolo 4 (è possibile scaricare il supplemento da questa pagina ) che i dati sono pubblicati in Kerrich [1964] e Freedman [1991, Tabella 1, pag. 248]. Il libro di Kerrich è probabilmente un'introduzione sperimentale alla teoria della probabilità e Freedman è lo stesso libro di testo già menzionato. Dubito tuttavia che la monografia del 1964 conterrebbe più dati di quella del 1946.


2

Quel libro di Kerrich può essere acquistato usato da Amazon, ma il prezzo indicato è piuttosto rigido!

Un'opzione migliore è https://openlibrary.org
È necessario creare un account lì, quindi installare Adobe Digital Editions per leggere il libro. (sembra che nessun altro programma lo farà, il libro scaricato ha DRM, gestione delle restrizioni digitali). Quindi è possibile scaricare ("prendere in prestito") il libro. Lo sto leggendo proprio ora. Immagino di poter prendere una copia dello schermo delle pagine con i risultati e usare ocr su quello. Per dopo ...

(No, sono passato velocemente attraverso il libro, sembra che solo i primi 2000 lanci vengano dati singolarmente, ma ci sono molti tavoli diversi con riepiloghi dei tiri. Ci sono anche tavoli per alcuni altri esperimenti, come disegnare palle da un'urna , nello stesso spirito.


3
Non è chiaro se hai notato che i primi 2000 risultati individuali sono già disponibili in questa discussione alla risposta di Bill Bradley . Il libro appare in Google books; Ho fornito un link in un altro commento . Attualmente Google si collega ad altri rivenditori di libri, oltre ad Amazon, dove il prezzo indicato (compresa la spedizione) è notevolmente più economico.
whuber

Grazie, ho notato i 2000 lanci disponibili qui sopra, ma speravo di poterne trovare altri nel libro stesso. Sembra di no. Non riesco a leggere il libro tramite google books, forse l'accesso dipende dalla geografia? A proposito, ora ho restituito il mio prestito da openlibrary, quindi altri possono provare ...
kjetil b halvorsen

1
Ho provato la stessa cosa quando è apparso questo thread, con gli stessi risultati negativi. :-( Non intendevo intimo che possiamo effettivamente leggere la versione su Google Libri: è solo una sorta di ricerca. Il valore principale di GB (almeno fino a quando le norme di Google non cambiano) è nel fornire collegamenti a luoghi dove potremmo acquistarlo.
whuber

1

Mi sono imbattuto in questo durante una ricerca di base su Kerrich. Ho preso i dati dalla risposta di Bill Bradley - apprezzo molto che i dati siano stati digitalizzati! Ho aggiunto i dati al pacchetto R che uso per insegnare, che è disponibile su GitHub .

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.