Tira un dado a 6 facce fino alla totale . Importo medio di quale è stata superata?


11

Ecco la domanda:

Tiri ripetutamente un dado a 6 facce fino a quando la somma dei tiri di dado è maggiore o uguale a M. Qual è la deviazione media e standard della somma meno M quando M = 300?

Devo scrivere un codice per rispondere a questo tipo di domande?

Per favore, dammi qualche suggerimento a riguardo. Grazie!


1
Aggiungi il [self-study]tag e leggi la sua wiki . Quindi dicci cosa hai capito finora, cosa hai provato e dove sei bloccato. Forniremo suggerimenti per aiutarti a rimanere bloccato.
gung - Ripristina Monica

2
Sospetto che possa essere letto come " molto grande " poiché credo che o darebbero quasi esattamente lo stesso risultato. Quello che vorrei fare è trovare la distribuzione della somma meno . M=300MM=301M=999M
Henry,

Risposte:


13

Puoi sicuramente usare il codice, ma non simulerei.

Ignorerò la parte "meno M" (alla fine puoi farlo abbastanza facilmente).

È possibile calcolare le probabilità in modo ricorsivo molto facilmente, ma la risposta effettiva (con un livello di precisione molto elevato) può essere calcolata da un semplice ragionamento.

Lasciate che i rotoli siano . Sia .S t = t i = 1 X iX1,X2,...St=i=1tXi

Let essere l'indice più piccolo in cui .S τMτSτM

P(Sτ=M)=P(got to M6 at τ1 and rolled a 6)+P(got to M5 at τ1 and rolled a 5)++P(got to M1 at τ1 and rolled a 1)=16j=16P(Sτ1=Mj)

inserisci qui la descrizione dell'immagine

allo stesso modo

P(Sτ=M+1)=16j=15P(Sτ1=Mj)

P(Sτ=M+2)=16j=14P(Sτ1=Mj)

P(Sτ=M+3)=16j=13P(Sτ1=Mj)

P(Sτ=M+4)=16j=12P(Sτ1=Mj)

P(Sτ=M+5)=16P(Sτ1=M1)

Equazioni simili alla prima sopra potrebbero quindi (almeno in linea di principio) tornare indietro fino a quando non raggiungi una qualsiasi delle condizioni iniziali per ottenere una relazione algebrica tra le condizioni iniziali e le probabilità che desideriamo (che sarebbe noiosa e non particolarmente illuminante) oppure puoi costruire le corrispondenti equazioni in avanti ed eseguirle in avanti dalle condizioni iniziali, il che è facile da eseguire numericamente (ed è così che ho controllato la mia risposta). Tuttavia, possiamo evitare tutto ciò.

Le probabilità dei punti eseguono medie ponderate delle probabilità precedenti; questi (geometricamente rapidamente) appianeranno qualsiasi variazione di probabilità dalla distribuzione iniziale (tutta la probabilità al punto zero nel caso del nostro problema). Il

Ad un'approssimazione (molto accurata) possiamo dire che da a dovrebbe essere quasi ugualmente probabile al momento (molto vicino ad esso), e quindi da quanto sopra possiamo scrivere che le probabilità sarà molto vicino all'essere in rapporti semplici e poiché devono essere normalizzati, possiamo semplicemente scrivere le probabilità.M - 1 τ - 1M6M1τ1

Vale a dire, possiamo vedere che se le probabilità di partire da a fossero esattamente uguali, ci sono 6 modi altrettanto probabili per arrivare a , 5 per arrivare a , e così via fino a 1 modo per arrivare a .M - 1 M M + 1 M + 5M6M1MM+1M+5

Cioè, le probabilità sono nel rapporto 6: 5: 4: 3: 2: 1 e sommano a 1, quindi sono banali da scrivere.

Il calcolo esatto (fino agli errori di arrotondamento numerico accumulato) eseguendo le ricorsioni di probabilità in avanti da zero (l'ho fatto in R) fornisce differenze nell'ordine di .Machine$double.eps( sulla mia macchina) dall'approssimazione sopra (che è, il semplice ragionamento lungo le righe sopra fornisce risposte esattamente esatte , dal momento che sono simili alle risposte calcolate dalla ricorsione come ci aspetteremmo che le risposte esatte dovrebbero essere).2.22e-16

Ecco il mio codice per questo (la maggior parte è solo inizializzando le variabili, il lavoro è tutto in una riga). Il codice inizia dopo il primo lancio (per salvarmi inserendo una cella 0, che è un piccolo fastidio da affrontare in R); ad ogni passo prende la cella più bassa che potrebbe essere occupata e si sposta in avanti con un tiro di dado (diffondendo la probabilità di quella cella sulle successive 6 celle):

 p = array(data = 0, dim = 305)
 d6 = rep(1/6,6)
 i6 = 1:6
 p[i6] = d6
 for (i in 1:299) p[i+i6] = p[i+i6] + p[i]*d6

(potremmo usare rollapply(from zoo) per farlo in modo più efficiente - o un numero di altre funzioni simili - ma sarà più facile da tradurre se lo tengo esplicito)

Si noti che d6è una funzione di probabilità discreta da 1 a 6, quindi il codice all'interno del loop nell'ultima riga sta costruendo medie ponderate in esecuzione di valori precedenti. È questa relazione che semplifica le probabilità (fino agli ultimi valori a cui siamo interessati).

Quindi ecco i primi 50 valori dispari (i primi 25 valori contrassegnati da cerchi). Ad ogni , il valore sull'asse y rappresenta la probabilità che si è accumulata nella cella posteriore prima di spostarla in avanti nelle 6 celle successive.t

inserisci qui la descrizione dell'immagine

Come vedi si attenua (a , il reciproco della media del numero di passi che ogni tiro di dado ti porta) abbastanza rapidamente e rimane costante.1/μ

E una volta che colpiamo , queste probabilità scompaiono (perché non stiamo mettendo la probabilità per i valori su e oltre a sua volta avanti)MMM

inserisci qui la descrizione dell'immagine

Quindi l'idea che i valori da a dovrebbero essere ugualmente probabili perché le fluttuazioni dalle condizioni iniziali verranno appianate è chiaramente vista come il caso.M - 6M1M6

Dal momento che il ragionamento non dipende da nulla ma che è abbastanza grande da eliminare le condizioni iniziali in modo che a siano quasi ugualmente probabili al momento , la distribuzione sarà essenzialmente la stessa per qualsiasi grande , come suggeriva Henry nei commenti.M - 1 M - 6 τ - 1 MMM1M6τ1M

In retrospettiva, il suggerimento di Henry (che è anche nella tua domanda) di lavorare con la somma meno M risparmierebbe un piccolo sforzo, ma l'argomento seguirà linee molto simili. Puoi procedere lasciando e scrivendo equazioni simili che collegano ai valori precedenti e così via.R 0Rt=St-MR0

Dalla distribuzione di probabilità, la media e la varianza delle probabilità sono quindi semplici.

Modifica: suppongo che dovrei dare la media asintotica e la deviazione standard della posizione finale meno :M

L'eccesso medio asintotico è e la deviazione standard è . A questo è accurato in misura molto maggiore di quello che probabilmente ti interesserà. 253 M=300253M=300


+1 Non ho compreso appieno questa risposta fino a quando non ho sviluppato la mia, che ora sembra essere superflua. Forse alcuni lettori vedranno valore nei risultati dell'illustrazione e della simulazione, quindi terrò aperta la mia risposta.
whuber

1
@whuber La mia risposta è molto meno concreta di quanto mi sarebbe piaciuto perché stavo operando partendo dal presupposto che si trattava di compiti a casa (quindi ho evitato di fare troppa derivazione o di dare qualsiasi codice - era più inteso come un contorno). Ho trovato difficile scrivere una risposta chiara su questo problema (è uno in cui la concretezza aiuta più del solito). Dal momento che hai dato una risposta che contiene i numeri e il codice effettivi (quale risposta penso che sicuramente dovrebbe rimanere), sento di poter fare alcune cose che speriamo possano rendere la mia risposta più facile da capire (essere più esplicito, dare il mio codice) .
Glen_b

Ho scritto una spiegazione molto migliore di questo tipo di problema da qualche parte un paio di anni fa. Se riesco a ricordare / capire come è andata proverò a includerne un po 'qui.
Glen_b

@Glen_b ha capito un po 'le equazioni. Sono un novizio. come iniziare a pensare in questo modo? Ci sono libri che potresti consigliare per questo scopo? La tua risposta sarebbe di grande aiuto.
Solito sospetto

Solito sospetto: ho scritto le equazioni immaginando una tavola da gioco come una lunga pista e andando "quali sono i modi in cui posso arrivare a questo spazio in un modo che si adatta alle condizioni del problema e con quali possibilità?"; L'ho fatto per uno spazio etichettato "M", quindi per lo spazio dopo di esso e così via. Ho scritto il calcolo simile andando avanti per il codice immaginando di essere vicino alla cella iniziale e dicendo "Se fossi qui, sarei il prossimo, con quali possibilità?". Le equazioni sono solo le risposte a queste domande.
Glen_b

8

Sia l'insieme di sequenze di somme parziali dei tiri di dado (con ciascuna sequenza che inizia da ). Per qualsiasi numero intero , sia l'evento che appare in una sequenza; questo è,Ω0nEnn

En={ωΩ|nω}.

Definire per essere il primo valore in pari o superiore a . La domanda richiede le proprietà di . Possiamo ottenere l'esatta distribuzione di , e da ciò tutto segue.XM(ω)ωMXM-MXM

Innanzitutto, nota che . Partizionando l'evento secondo il valore immediatamente precedente in , e lasciando che sia la probabilità di osservare la faccia su un tiro del dado ( ), ne consegue cheXM(ω)-M{0,1,2,3,4,5}XM-M=Kωp(io)=1/6ioio=1,2,3,4,5,6

Pr(XM-M=K)=Σj=K6Pr(EM+K-j)p(j)=16Σj=K6Pr(EM+K-j).

A questo punto potremmo sostenere euristicamente che, con una buona approssimazione per tutti tranne la più piccola ,Questo perché il valore atteso di un lancio è e il suo reciproco dovrebbe essere la frequenza a lungo termine limitante e stabile di qualsiasi valore particolare in .M

Pr(Eio)2/7.
(1+2+3+4+5+6)/6=7/2ω

Un modo rigoroso per dimostrarlo è il modo in cui potrebbe verificarsi . Si verifica e il lancio successivo era ; oppure si verifica e il tiro successivo era un ; oppure ... o verifica e il tiro successivo era un . Questa è una partizione esaustiva delle possibilità, da cuiEioEio-11Eio-22Eio-66

Pr(Eio)=Σj=16Pr(Eio-j)p(j)=16Σj=16Pr(Eio-j).

I valori iniziali di questa sequenza sono

Pr(E0)=1;Pr(E-io)=0,io=1,2,3,....

Figura: trama di E_i

Questo diagramma di contro mostra la rapidità con cui le probabilità si stabilizzano su una costante , indicata dalla linea tratteggiata orizzontale.Pr(Eio)io2/7

Esiste una teoria standard di tali sequenze ricorsive. Può essere sviluppato mediante la generazione di funzioni, catene di Markov o persino manipolazione algebrica. Il risultato generale è che esiste una formula in formato chiuso per . Pr(Eio) Sarà una combinazione lineare di una costante e poteri delle radici del polinomioioesimo

X6-p(1)X5-p(2)X4-p(3)X3-p(6)=X6-(X5+X4+X3+X2+X+1)/6.

La magnitudine più grande di queste radici è approssimativamente . In una rappresentazione in virgola mobile a precisione doppia, è essenzialmente zero. Pertanto, per , possiamo ignorare completamente tutto tranne la costante. Questa costante è .exp(-0.314368)exp(-36.05)io»-36.05/-0.314368=1152/7

Di conseguenza, per , per tutti gli scopi pratici possiamo prendere , da cuiM=300»115EM+K-j=2/7

Pr(XM-M=(0,1,2,3,4,5))=(27)(16)(6,5,4,3,2,1).

Il calcolo della media e della varianza di questa distribuzione è semplice e immediato.


Ecco una Rsimulazione per confermare queste conclusioni. Genera quasi 100.000 sequenze attraverso , tabula i valori di e applica un test per valutare se i risultati sono coerenti con quanto sopra. Il valore p (in questo caso) di è abbastanza grande da indicare che sono coerenti.X 300 - 300 χ 2 0,1367M+5=305X300-300χ20,1367

M <- 300
n.iter <- 1e5
set.seed(17)
n <- ceiling((2/7) * (M + 3*sqrt(M)))
dice <- matrix(ceiling(6*runif(n*n.iter)), n, n.iter)
omega <- apply(dice, 2, cumsum)
omega <- omega[, apply(omega, 2, max) >= M+5]
omega[omega < M] <- NA
x <- apply(omega, 2, min, na.rm=TRUE)
count <- tabulate(x)[0:5+M]
(cbind(count, expected=round((2/7) * (6:1)/6 * length(x), 1)))
chisq.test(count, p=(2/7) * (6:1)/6)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.