Qual è il nome dell'errore statistico in base al quale i risultati delle precedenti lancette di monete influenzano le convinzioni sulle successive lancette di monete?


28

Come tutti sappiamo, se lanci una moneta che ha le stesse probabilità di atterrare teste come fa la coda, allora se lanci la moneta molte volte, metà del tempo otterrai teste e metà del tempo otterrai code.

Parlando di questo con un amico, dissero che se avessi lanciato la moneta 1000 volte, e diciamo che le prime 100 volte è atterrato, allora le probabilità di far cadere una coda sono aumentate (la logica è che se è imparziale, poi quando lo avrai girato 1000 volte avrai circa 500 teste e 500 code, quindi le code devono essere più probabili).

So che si tratta di un errore, poiché i risultati passati non influenzano i risultati futuri. C'è un nome per quel particolare errore? Inoltre, c'è una spiegazione migliore del perché questo è fallace?


8
Se lanci una moneta 100 volte e atterra 100 volte, la probabilità è che non sia una moneta imparziale.
Robert,

1
@Robert In che modo? Poiché ogni vibrazione è indipendente dall'altra, la possibilità che sarebbe H 100x è la stessa di una sequenza non corrispondente di H & T, o 100x T
yuritsuki

11
@thinlyveiledquestionmark Mi piacerebbe giocare a poker con te ... ma solo se mi è permesso fare affari. Penso che Robert significhi che la realizzazione di 100 H in 100 prove cambierebbe la sua convinzione dalla moneta equa alla moneta ingiusta. Dati questi dati di 100 H in 100 prove, dovresti essere in possesso di un precedente molto forte su Pr(H) per non spostare sensibilmente il posteriore.
Sycorax dice di reintegrare Monica il

5
@thinlyveiledquestionmark Devi stare attento. Dati i lanci indipendenti, ogni sequenza di 100 giri di H o T è ugualmente probabile: 100H è probabile come 50H 50T, è probabile come HTHTHTHT ... HT e così via. Ma è molto meno probabile che ottenga 100H rispetto a ottenere un totale di 50 teste, perché ci sono modi diversi per avere 50 lanci in testa e 50 invertiti. 1029
Lagerbaer,

3
L'idea di Robert è perfettamente valida e potrebbe essere la fonte di "l'errore" in primo luogo. I nostri cervelli sono collegati nel senso bayesiano, non frequentista. Le informazioni "perfette" come la "moneta assolutamente giusta" raramente esistono in natura. Pertanto, 100 Heads su 100 tentativi ci portano praticamente a credere che P(Heun'dS)>0.5
PA6OTA,

Risposte:



32

La prima frase di questa domanda, incorpora un altro errore (correlato):

"Come tutti sappiamo, se lanci una moneta che ha le stesse probabilità di atterrare teste come fa la coda, allora se lanci la moneta molte volte, metà del tempo otterrai teste e metà del tempo otterrai code ."

No, non lo capiremo, non avremo la testa per metà del tempo e la coda per metà del tempo. Se dovessimo ottenerlo, dopo tutto il giocatore d'azzardo non si sbaglierebbe . L'espressione matematica per questa affermazione verbale è la seguente: per alcuni "grandi" (ma finiti) , abbiamo n h =n , dove evidentementenhindica il numero di volte in cui la moneta atterra la testa. Poichénè finito, alloran+1è anche finito e un valore distinto dan. Che cosa succededopolan'+1della medaglia è stato fatto? O è atterrato teste o no. In entrambi i casi,nhha appena smesso di essere uguale a "metà del numero di lanci".nh=n2nhnn+1nn+1nh

Ma forse quello che intendevamo veramente era un "inimmaginabilmente grande" ? Quindi affermiamon

limnnh=n2

Ma qui, l'RHS ("lato destro") contiene che dall'LHS ("lato sinistro") è passato all'infinito. Quindi l'RHS è anche infinito, e quindi ciò che dice questa affermazione è che il numero di volte in cui la moneta atterrerà teste è uguale all'infinito, se lanciamo la moneta un numero infinito di volte (la divisione per 2 è trascurabile):n2

limnnh=n2=

Questa è un'affermazione essenzialmente corretta, ma inutile , e ovviamente non ciò che abbiamo in mente.

In tutto, l'affermazione della domanda non regge, indipendentemente dal fatto che i "tiri totali" siano considerati finiti o meno.

Forse allora dovremmo dichiarare

limnnhn=12?

In primo luogo, questo si traduce in "Il rapporto tra il numero di atterrato teste sul totale di lanci tende al valore quando il numero di lanci tende all'infinito", che è una dichiarazione diversa - no "metà del totale dei lanci" Qui. Inoltre, è così che a volte viene ancora percepita la probabilità come un limite deterministico delle frequenze relative. Il problema con questa affermazione è che contiene nell'LHS una forma indeterminata: sia il numeratore che il denominatore vanno all'infinito. 1/2

Mmmm, portiamo l' arsenale variabile casuale . Definisci una variabile casuale come prendendo il valore 1 se l' i -esimo lancio è arrivato in testa, 0 se è arrivato in coda. Quindi abbiamo n hXi1i0

nhn=1ni=1nXio

Ora possiamo almeno affermare

limn1ni=1nXi=12?

No . Questo è un limite deterministico. Permette tutte le possibili realizzazioni della sequenza del 's, e quindi non ancora garanzia che un limite esisterà, per non parlare essendo uguale a 1 / 2X1/2 . In effetti una simile affermazione può essere vista solo come un vincolo alla sequenza e distruggerebbe l'indipendenza dei tiri.

Quello che possiamo dire è che questa media converge somma di probabilità ( "debolmente") per (Bernoulli -Weak legge dei grandi numeri),1/2

limnPr(|1ni=1nXi12|<ε)=1,ε>0

e nel caso in esame, che converge anche quasi sicuramente ("fortemente") (Borel - Legge forte di grandi numeri)

Pr(limn1ni=1nXi=12)=1,

Ma queste sono affermazioni probabilistiche circa la probabilità associata alla differenza tra e 1 / 2 , e non circa il limite della differenza n h - n tnh/n1/2nhnt (che secondo la falsa dichiarazione dovrebbe essere pari a zero - e non è ).

Devo ammettere che ci vuole uno sforzo intellettuale dedicato per capire veramente queste due affermazioni e come differiscono (nella "teoria" e nella "pratica") da alcune delle precedenti - Non pretendo ancora una comprensione così profonda per me stesso.


1
Forse una delle migliori risposte educative che ho letto da molto tempo. Molto bene.
Pete Mancini,

@AlecosPapadopoulos Penso che aiuterebbe la risposta a mettere la cosa che possiamo dire in una formula come hai fatto con le false formulazioni. Immagino sia qualcosa come \ lim P (\ frac {1} {n} \ sum X_i) = 1?
Kutschkem,

@kutschkem Ottimo suggerimento. Appena fatto.
Alecos Papadopoulos,

12

Questo errore ha molti nomi.

1) Probabilmente è meglio conosciuto come errore del giocatore d'azzardo

2) a volte viene anche chiamata la ' legge dei piccoli numeri ' (vedi anche qui ) (perché si riferisce all'idea che le caratteristiche della popolazione debbano essere riflesse in piccoli campioni) - che penso sia un nome preciso per il suo contrasto con la legge di grandi numeri, ma purtroppo lo stesso nome viene applicato alla distribuzione di Poisson (e talvolta anche usato dai matematici per significare qualcos'altro di nuovo), quindi può essere fonte di confusione.

3) tra le persone che credono all'errore che a volte viene chiamata la " legge delle medie ", che in particolare tende ad essere invocata dopo una corsa senza esito per sostenere che il risultato è "dovuto", ma ovviamente non è così breve la legge esiste - nulla agisce per "compensare" uno squilibrio iniziale - l'unico modo in cui una discrepanza iniziale viene eliminata è il volume di valori successivi che a loro volta hanno una media di 1/2 .

HiTio essere il numero di code osservate fino alla fine del file io-th trial. Nota cheio=Hio+Tio

È interessante notare che a lungo termine (ad es n), mentre Hnn converge in probabilità a 12, E|Hn-Tn| cresce con l'aumentare n- anzi cresce senza limiti; non c'è niente "spingerlo indietro verso 0".


1

Stai pensando a "stocastico"? Il lancio di una moneta giusta (o il lancio di un dado giusto) è stocastico (cioè indipendente), nel senso che non dipende da un lancio precedente di tale moneta. Supponendo un equo contro, il fatto che la moneta sia stata lanciata cento volte con un centinaio di teste risultanti non cambia il fatto che il prossimo lancio ha una probabilità del 50/50 di essere teste.

Al contrario, la probabilità di pescare una determinata carta che pesca una carta da un mazzo di carte senza sostituzione non è stocastica perché la probabilità di pescare una determinata carta cambierà la probabilità di pescare la carta nella prossima pesca (se fosse con sostituzione, sarebbe stocastico).


stochastic does not mean independent
Ben Voigt

1
"Assuming a fair con...the next flip has a 50/50 chance of being heads", I think you do have a deep philosophical truth here. You could expand the answer to explain what happens if it's an unfair (AKA regular?) con.
hyde

0

Adding on to Glen_b's and Alecos's responses, let's define Xn to be the number of heads in the first n trials. A familiar result using the normal approximation to the binomial is that Xn is approximately N(n/2,n/4). Now, before observing the first 100 tosses, your friend is correct that there is a good chance that X1000 will be close to 500. In fact,

P(469<X1000<531).95.

However, after observing X100=100, let's define Y900 to be number of heads in the last 900 trials, then

P(469<X1000<531X100=100)=P(369<Y900<431).1

since Y900 approximately N(450,15).

Thus, after observing 100 heads in the first 100 trials, there is no longer a high probability of observing close to 500 successes in the first 1000 trials, assuming of course that the coin is fair. Note that this is a concrete example illustrating that an initial imbalance is unlikely to be compensated for in the short run.

Further, note that if n=1,000,000, then

P(499,020<X1,000,000<500,980).95

but the impact of the imbalance in the first 100 tosses is negligible in the long run since

P(499,020<X1,000,000<500,980X100=100)=P(498,920<Y999,900<500880).949


0

You are refering to Gambler's fallacy, although this is not entirely correct.

Indeed if phrased as "given an assumed fair coin and one observes a given sequence of outcomes, what is the estimation of the elementary probabilities of the coin", this becomes more apparent.

Indeed the "fallacy" is related only to (assumed) fair coins, where the various products of probs are equal. However this entails an interpretation that is in contrast to (study of) similar cases with a coin having another (not-symmetric/biased) probability distribution.

For a further discusion of this (and a little twist) see this question.

This is exactly like the fallacy used in many statistical studies where correlation implies causality. But it can be a hint of a causality relation or common cause.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.