Concetto di statistica per spiegare perché hai meno probabilità di capovolgere lo stesso numero di teste delle code, man mano che aumenta il numero di capriole?


28

Sto lavorando sull'apprendimento delle probabilità e delle statistiche leggendo alcuni libri e scrivendo un po 'di codice, e simulando i lanci di monete ho notato qualcosa che mi ha colpito leggermente in contrasto con la propria intuizione ingenua. Se lanci una moneta giusta volte, il rapporto tra testa e croce converge verso 1 all'aumentare di , esattamente come ti aspetteresti. D'altra parte, man mano che aumenta, sembra che divenga meno probabile capovolgere lo stesso numero esatto di teste delle code, ottenendo così un rapporto esattamente di 1.nnn

Ad esempio (alcuni output dal mio programma)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

La mia domanda è questa: esiste un concetto / principio nella statistica / teoria della probabilità che spiega questo? In tal caso, quale principio / concetto è?

Link al codice se qualcuno è interessato a vedere come l'ho generato.

-- modificare --

Per quello che vale, ecco come lo stavo spiegando a me stesso in precedenza. Se una moneta giusta volte e conti il ​​numero di teste, stai praticamente generando un numero casuale. Allo stesso modo se fai la stessa cosa e conti le code, stai anche generando un numero casuale. Quindi, se conti entrambi, stai davvero generando due numeri casuali e quando aumenta, i numeri casuali diventano più grandi. E più grandi sono i numeri casuali che generi, maggiori sono le possibilità che si perdano a vicenda. Ciò che rende questo interessante è che i due numeri sono effettivamente collegati in un certo senso, con il loro rapporto che converge verso uno man mano che diventano più grandi, anche se ogni numero è casuale in isolamento. Forse sono solo io, ma trovo quel tipo di pulito. nn


Cerchi spiegazioni intuitive o matematiche?
Glen_b

1
Entrambi, davvero. Penso di capire il motivo in un senso intuitivo, ma mi piacerebbe capire il ragionamento formale che sta dietro.
mindcrime

1
Sai come calcolare le probabilità binomiali e applicarle a questa situazione? In caso contrario, cercalo e calcola i calcoli.
Mark L. Stone,

Caspita, ci sono molte buone risposte a questa domanda. Mi sento male per dover accettare l'uno e non l'altro. Vorrei solo dire che apprezzo tutte le risposte e tutti coloro che hanno avuto il tempo di condividere le loro opinioni su questo.
mindcrime

Risposte:


31

Si noti che il caso in cui il numero di teste e il numero di code sono uguali è "esattamente la metà delle volte che si ottengono teste". Quindi continuiamo a contare il numero di teste per vedere se è la metà del numero di lanci o confrontare in modo equivalente la proporzione di teste con 0,5.

Più lanci, maggiore è il numero di conteggi possibili di teste che puoi avere - la distribuzione diventa più diffusa (ad es. Un intervallo per il numero di teste che contiene il 95% della probabilità aumenterà all'aumentare del numero di lanci) , quindi la probabilità di esattamente mezza testa tenderà a diminuire man mano che lanciamo di più.

Di conseguenza, la proporzione di teste prenderà più valori possibili; vedi qui, dove passiamo da 100 lanci a 200 lanci:

inserisci qui la descrizione dell'immagine

Con 100 lanci possiamo osservare una proporzione di 0,49 teste o 0,50 teste o 0,51 teste (e così via - ma niente tra questi valori), ma con 200 lanci possiamo osservare 0,49 o 0,495 o 0,50 o 0,50 o 0,50 - il la probabilità ha più valori da "coprire" e quindi ognuno tenderà a ottenere una quota minore.

Prendere in considerazione di quello che hai lanci con una certa probabilità p i di ottenere i teste (sappiamo queste probabilità ma non è fondamentale per questa parte), e si aggiungono altri due lanci. In 2 n tiri, n teste è il risultato più probabile ( p n > p n ± 1 e scende da lì).2npii2nnpn>pn±1

Qual è la possibilità di avere teste in 2 n + 2 tiri?n+12n+2

(Contrassegna queste probabilità con modo da non confonderle con le precedenti; lascia che P (HH) sia la probabilità di "Testa, Testa" nei prossimi due lanci, e così via)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

cioè se aggiungi due lanci in più, la probabilità del valore medio diminuisce naturalmente perché fa la media del valore più probabile (medio) con la media dei valori più piccoli su entrambi i lati)

Quindi, fintanto che sei a tuo agio che il picco sarà nel mezzo (per ), La probabilità di esattamente la metà teste deve diminuire n sale.2n=2,4,6,...n


In effetti, possiamo dimostrare che per grandi , p n diminuisce proporzionalmente a 1npn (non sorprende, poiché la distribuzione del numero standardizzato di teste si avvicina alla normalità e la varianza della proporzione di teste diminuisce conn).1nn


Come richiesto, ecco il codice R che produce qualcosa di simile al diagramma sopra:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

1
Sono d'accordo con @RustyStatistician sopra per quanto riguarda la parola-parola del tuo grafico. Credito extra per il puntatore al codice.
TomRoche,

Figura e spiegazione fantastiche!

@Tom Ho incluso il codice che fa tutto tranne che per rendere verde il "200" nel titolo.
Glen_b

1
@Glen_b Grazie per l'ennesimo grande post e la generosità di condividere le righe di codice. Trama bella! È difficile ammetterlo, ma sto riscontrando problemi con l'espressione matematica del concetto nel tuo post, e in particolare l'uso della maiuscola . P
Antoni Parellada,

1
@Antoni significa semplicemente "probabilità di ottenere 'Testa, Testa' nei due lanci aggiuntivi". Per ottenere n + 1 teste in 2n + 2 tiri, con 2n tiri devi avere avuto n-1 teste (e poi lanciato 2 teste) o n teste (e quindi lanciato 1 testa) o n + 1 testa (e poi lanciato 0 teste). P(HH)
Glen_b -Restate Monica

19

Bene sappiamo che la Legge dei Grandi Numeri è ciò che garantisce la prima conclusione del tuo esperimento, vale a dire che se lanci una moneta giusta volte, il rapporto tra testa e croce converge verso 1 man mano che aumenta n . nn

Quindi nessun problema lì. Tuttavia, questo su tutta la Legge dei Grandi Numeri ci dice in questo scenario.

Ma così ora, pensa a questo problema in modo più intuitivo. Pensa a lanciare una moneta un numero limitato di volte, ad esempio: .n=2,4,8,10

Quando lanci una moneta due volte, ovvero , pensa ai possibili scenari delle due lancette. (Qui H indicherà le teste e T indicherà le code). Sul lancio pugno si potrebbe avere ottenuto H e sul secondo flip si potrebbe avere ottenuto T . Ma questo è solo un modo in cui i due lanci potrebbero essere emersi. Avresti potuto anche ottenere sul primo flip T e sul secondo flip H , e tutte le altre possibili combinazioni. Quindi alla fine della giornata, quando lanci 2 monete, le possibili combinazioni che potresti vedere sui due lanci sono S = { H H , H T ,n=2HTHTTH e quindi ci sono 4 possibili scenari per lanciare n = 2 monete.

S={HH,HT,TH,TT}
n=2

Se dovessi lanciare 4 monete, il possibile numero di combinazioni che potresti vedere sarebbe e quindi ci sono 16 possibili scenari per il lancio di n = 4 monete.

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

Lanciare monete porta a 256 combinazioni.n=8

Lanciare monete porta a 1.024 combinazioni.n=10

E in particolare, lanciando qualsiasi numero monete si ottengono 2 n possibili combinazioni.n2n

Ora proviamo ad affrontare questo problema dal punto di vista probabilistico. Guardando indietro al caso quando , sappiamo che la probabilità di ottenere esattamente lo stesso numero di Heads and Tails (cioè, come si dice un rapporto esattamente di 1) è P r ( Rapporto esattamente di 1 ) = 2n=2 Quandon=4, sappiamo che la probabilità di ottenere esattamente lo stesso numero di teste e code è Pr(rapporto esattamente 1)=6

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

E in generale, poiché tende a crescere, abbiamo che la probabilità di ottenere esattamente lo stesso numero di teste e code va a 0.n

In altre parole, come , abbiamo quel P r ( rapporto esattamente di 1 ) 0n

Pr(Ratio of exactly 1)0

E così, per rispondere alla tua domanda. In realtà ciò che stai osservando è solo una conseguenza del fatto che ci saranno molte più combinazioni di lanci di monete in cui il numero di teste e code non è uguale rispetto al numero di combinazioni in cui sono uguali.



Come suggerisce @Mark L. Stone, se ti senti a tuo agio con la formula binomiale e le variabili casuali binomiali, puoi usarlo per mostrare lo stesso argomento.

Sia il numero di teste registrate quando si lancia una moneta buona n volte. possiamo considerare X come una variabile casuale proveniente da una distribuzione binomiale, cioè X B i n ( n , p = 0,5 ) (qui assumiamo p = 0,5 perché abbiamo a che fare con una moneta giusta) quindi la probabilità di ottenere esattamente lo stesso numero di teste del numero di code (cioè un rapporto esattamente di 1) èXnXXBin(n,p=0.5)p=0.5

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

n(nn/2)0.5n0n


2
0.5n0n(nn/2)0.5n0n!0.5n0

@Glen_b Non ho abbastanza punti per commentare il tuo post, ma grafica fantastica!

Grazie @RustyStatistician, questo aiuta molto. La prima parte della tua spiegazione corrisponde praticamente al modo in cui la pensavo, ma non sono abbastanza lontana dalle mie statistiche per sapere come elaborarla usando la distribuzione binomiale. Fondamentalmente ho letto sul mio libro una volta, senza risolvere problemi o altro, e ora sto tornando indietro dall'inizio e scrivendo codice per esplorare vari aspetti del materiale.
mindcrime

@mindcrime suona alla grande! Sono contento di poterti aiutare.

5

Vedi il triangolo di Pascal .

La probabilità di risultati del lancio della moneta è rappresentata dai numeri lungo la riga inferiore. Il risultato di teste e code uguali è il numero medio. Man mano che l'albero diventa più grande (cioè, più lanci), il numero medio diventa una proporzione più piccola della somma della riga inferiore.



1

Mentre il rapporto tra teste e code converge a 1, l'intervallo di numeri possibili diventa più ampio. (Sto inventando i numeri). Supponiamo che per 100 tiri la probabilità sia del 90% di avere tra il 45% e il 55% di prevalenza. È il 90% che ottieni da 45 a 55 teste. 11 possibilità per il numero di teste. Circa il 9% circa di un numero uguale di teste e code.

Supponiamo che per 10.000 tiri la probabilità sia del 95% di ottenere tra il 49% e il 51% di prevalenza. Quindi il rapporto è diventato molto più vicino a 1. Ma ora hai tra 4.900 e 5.100 teste. 201 possibilità. La probabilità di numeri uguali è solo all'incirca dello 0,5% circa.

E con un milione di tiri hai la certezza di avere tra il 49,9% e il 50,1% di teste. Questo è un intervallo da 499.000 a 501.000 capi. 2.001 possibilità. La possibilità è ora scesa allo 0,05%.

Ok, la matematica è stata inventata. Ma questo dovrebbe darti un'idea del "perché". Anche se il rapporto si avvicina a 1, il numero di possibilità aumenta, in modo che colpire esattamente metà testa e metà code, diventa sempre meno probabile.

Un altro effetto pratico: nella pratica è improbabile che tu abbia una moneta in cui la probabilità di lanciare teste è esattamente del 50%. Potrebbe essere del 49.99371% se hai una moneta davvero buona. Per un numero limitato di tiri questo non fa differenza. Per numeri grandi, la percentuale di capi converge al 49.99371%, non al 50%. Se il numero di tiri è abbastanza grande, lanciare il 50% o più di teste diventerà molto, molto improbabile.


0

Bene, una cosa da notare è che con un numero pari di capriole (altrimenti la probabilità di uguali salti di testa e croce è ovviamente esattamente zero), il risultato più probabile sarà sempre quello con esattamente lo stesso numero di capovolte di quelle a croce.

n

(1+X2)n.
n
pn=2-n(nn/2).

Usando l'approssimazione di Stirling per n!, arrivi a qualcosa del genere

p1πn/2
per la probabilità di esattamente n/2 teste (e corrispondentemente code) lancia per ncapovolgimenti generali. Quindi la probabilità assoluta di questo risultato converge a 0 ma molto più lentamente della maggior parte degli altri risultati, con i casi estremi di 0 teste (o in alternativa 0 code)2-n.

2
La tua risposta potrebbe essere migliorata definendo accuratamente le quantità nelle tue espressioni. Cosa èn? Cosa èp?
Sycorax dice di reintegrare Monica il

0

Supponi di lanciare una moneta due volte. Esistono quattro possibili esiti: HH, HT, TH e TT. In due di questi, hai un uguale numero di teste e code, quindi c'è una probabilità del 50% di ottenere lo stesso numero di teste e code.

Supponiamo ora di lanciare una moneta 4.306.492.102 volte. Ti aspetti una probabilità del 50% di finire con esattamente 2.153.246.051 teste e 2.153.246.051 code?


No, la mia intuizione mi ha detto che le possibilità di ottenere una corrispondenza esatta erano basse, solo perché i numeri stavano aumentando. Ma volevo simularlo solo per confermare il mio pensiero. Quando ho visto che è andata in quel modo, sono rimasto incuriosito dal ragionamento formale alla base del perché sia ​​così. Mi sembra interessante che il rapporto risultante sta convergendo verso 1 e contemporaneamente diventare meno probabilità di essere esattamente 1.
Mindcrime

3
Un modo di pensare è quello in generale n ci sono molti altri modi per essere vicini al 50-50 rispetto a quelli per i piccoli n.
Daniel McLaury,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.