Disegna numeri interi in modo indipendente e uniforme a caso da 1 a

18

Vorrei disegnare numeri interi da 1 a qualche specifica lanciando un certo numero di dadi a sei facce giusti (d6). Una buona risposta spiegherà perché il suo metodo produce numeri interi uniformi e indipendenti . $N$

Come esempio illustrativo, sarebbe utile spiegare come funziona una soluzione per il caso di . $N=150$

Inoltre, desidero che la procedura sia il più efficiente possibile: tira il numero minimo di d6 in media per ogni numero generato.

Sono ammesse conversioni dal senario al decimale.

Questa domanda è stata ispirata da questo thread Meta .

— Sycorax dice Reinstate Monica
fonte

12

L'insieme $\Omega(d,n)$ di risultati identificabili distinti in $n$ tiri indipendenti di un dado con $d=6$ facce ha $d^n$ elementi. Quando il dado è giusto, ciò significa che ogni risultato di un tiro ha probabilità $1/d$ e l'indipendenza significa che ciascuno di questi risultati avrà quindi probabilità $(1/d)^n:$ cioè, hanno una distribuzione uniforme $\mathbb{P}_{d,n}.$

Supponiamo che tu abbia escogitato una procedura $t$ che determini $m$ esiti di un dado con lato $c (=150)$ - cioè un elemento di $\Omega(c,m)$ oppure segnala un fallimento (il che significa che dovrai ripetere per ottenere un risultato). Questo è,

t : Ω (d, n) \to Ω (c, m) \cup {Failure} .

$t:\Omega(d,n)\to\Omega(c,m)\cup\{\text{Failure}\}.$

Sia $F$ la probabilità traduca in un fallimento e si noti che è un multiplo integrale di diciamo $t$ $F$ $d^{-n},$

F = Pr (t (ω) = Failure) = N F d - n .

$F = \Pr(t(\omega)=\text{Failure}) = N_F\, d^{-n}.$

(Per riferimento futuro, si noti che il numero previsto di volte che deve essere invocato prima di non fallire è ) $t$ $1/(1-F).$

Il requisito che questi risultati in siano uniformi e indipendenti condizionale sulla non denunciare i mezzi di guasto che conserve probabilità, nel senso che per ogni evento $\Omega(c,m)$ $t$ $t$ $\mathcal{A}\subset\Omega(c,m),$

P d , n ( t * A ) 1 - F = P c, m (A) (1)

$\frac{\mathbb{P}_{d,n}\left(t^{*}\mathcal{A}\right)}{1-F}= \mathbb{P}_{c,m}\left(\mathcal{A}\right) \tag{1}$

dove

t * (A) = {ω \in Ω ∣ t (ω) \in A}

$t^{*}\left(\mathcal A\right) = \{\omega\in\Omega\mid t(\omega)\in\mathcal{A}\}$

è l'insieme dei tiri di dado che la procedura assegna all'evento $t$ $\mathcal A.$

Considera un evento atomico , che deve avere probabilitàSia (i tiri di dado associati a ) hanno elementi . diventa $\mathcal A = \{\eta\}\subset\Omega(c,m)$ $c^{-m}.$ $t^{*}\left(\mathcal A\right)$ $\eta$ $N_\eta$ $(1)$

N η d - n 1 - N F d - n = P d , n ( t * A ) 1 - F = P c, m (A) = c - m . (2)

$\frac{N_\eta d^{-n}}{1 - N_F d^{-n}} = \frac{\mathbb{P}_{d,n}\left(t^{*}\mathcal{A}\right)}{1-F}= \mathbb{P}_{c,m}\left(\mathcal{A}\right) = c^{-m}.\tag{2}$

È immediato che siano tutti uguali a un numero intero $N_\eta$ $N.$ Resta solo da trovare le procedure più efficienti Il numero atteso di non guasti per rullo del lati dado IS $t.$ $c$

1 m (1 - F) .

$\frac{1}{m}\left(1 - F\right).$

Ci sono due implicazioni immediate e ovvie. Uno è che se riusciamo a mantenere piccola man mano che cresce, l'effetto della segnalazione di un errore è asintoticamente zero. L'altro è che per ogni dato (il numero di lanci del dado a per simulare), vogliamo rendere più piccolo possibile. $F$ $m$ $m$ $c$ $F$

Diamo un'occhiata più da vicino a cancellando i denominatori: $(2)$

N c m = d n - N F > 0.

$N c^m = d^n - N_F \gt 0.$

Ciò rende ovvio che in un determinato contesto (determinato da ), viene reso il più piccolo possibile rendendo uguale al multiplo più grande di che è minore o uguale a Possiamo scrivere questo in termini della più grande funzione intera (o "piano") come $c,d,n,m$ $F$ $d^n-N_F$ $c^m$ $d^n.$ $\lfloor*\rfloor$

N = ⌊ d n c m ⌋ .

$N = \lfloor \frac{d^n}{c^m} \rfloor.$

Infine, è chiaro che dovrebbe essere il più piccolo possibile per la massima efficienza, perché misura la ridondanza in . In particolare, il numero previsto di rotoli del dado lato necessario per produrre un rotolo del dado lato è $N$ $t$ $d$ $c$

N \times n m \times 1 1 - F .

$N \times \frac{n}{m} \times \frac{1}{1-F}.$

Pertanto, la nostra ricerca di procedure ad alta efficienza dovrebbe concentrarsi sui casi in cui è uguale o appena maggiore di un certo potere $d^n$ $c^m.$

L'analisi termina mostrando che per un dato e c'è una sequenza di multipli per i quali questo approccio approssima la perfetta efficienza. Ciò equivale a trovare per cui avvicina a nel limite (garantendo automaticamente ). Una di queste sequenze si ottiene prendendo e determinando $d$ $c,$ $(n,m)$ $(n,m)$ $d^n/c^m \ge 1$ $N=1$ $F\to 0$ $n=1,2,3,\ldots$

m = ⌊ n log d log c ⌋ . (3)

$m = \lfloor \frac{n\log d}{\log c} \rfloor.\tag{3}$

La prova è semplice.

Tutto ciò significa che quando siamo disposti a lanciare il dado a faccia di originale un numero sufficientemente grande di volte possiamo aspettarci di simulare quasi risultati di un dado a faccia per tiro . Equivalentemente, $d$ $n,$ $\log d / \log c = \log_c d$ $c$

È possibile simulare un gran numero di rotoli indipendenti di senso unico stampo utilizzando un equo sided die utilizzando una media di lancia per risultato dove può essere reso arbitrariamente piccolo scegliendo sufficientemente grande. $m$ $c$ $d$ $\log(c)/\log(d) + \epsilon = \log_d(c) + \epsilon$ $\epsilon$ $m$

Esempi e algoritmi

Nella domanda, e donde $d=6$ $c=150,$

log d (c) = log ( c ) log ( d ) \approx 2.796489.

$\log_d(c) = \frac{\log(c)}{\log(d)} \approx 2.796489.$

Pertanto, la migliore procedura possibile richiederà, in media, almeno tiri di a per simulare ogni risultato. $2.796489$ d6d150

L'analisi mostra come farlo. Non abbiamo bisogno di ricorrere alla teoria dei numeri per realizzarla: possiamo semplicemente tabulare i poteri e i poteri e confrontarli per trovare dove sono vicini. Questo calcolo della forza bruta fornisce coppie $d^n=6^n$ $c^m=150^m$ $c^m \le d^n$ $(n,m)$

(n, m) \in {(3, 1), (14, 5), \dots}

$(n,m) \in \{(3,1), (14,5), \ldots\}$

per esempio, corrispondente ai numeri

(6 n, 150 m) \in {(216, 150), (78364164096, 75937500000), \dots} .

$(6^n, 150^m) \in \{(216,150), (78364164096,75937500000), \ldots\}.$

Nel primo caso vedrebbe associato dei risultati di tre rotoli al fallimento e gli altri risultati sarebbero ciascuno associato con un singolo risultato di una . $t$ $216-150=66$ d6 $150$ d150

Nel secondo caso vedrebbe associato dei risultati di 14 rotoli di guasto - circa 3,1% di tutti - e altrimenti sarebbe uscita una sequenza di 5 risultati di uno . $t$ $78364164096-75937500000$ d6d150

Un semplice algoritmo per implementare $t$ identifica le facce del dado con lato con i numeri e le facce del dado con lato con i numeri Gli tiri del primo dado sono interpretati come un numero -digit nella base Questo viene convertito in un numero in base Se ha al massimo cifre, la sequenza delle ultime cifre è l'output. Altrimenti, restituisce Fallimento invocando se stesso in modo ricorsivo. $d$ $0,1,\ldots, d-1$ $c$ $0,1,\ldots, c-1.$ $n$ $n$ $d.$ $c.$ $m$ $m$ $t$

Per sequenze molto più lunghe, puoi trovare coppie adatte considerando ogni altro convergente dell'espansione della frazione continua di La teoria delle frazioni continue mostra che questi convergenti si alternano tra essere inferiore a e maggiore di esso (supponendo che non sia già razionale). Scegli quelli che sono meno di $(n,m)$ $n/m$ $x=\log(c)/\log(d).$ $x$ $x$ $x.$

Nella domanda, i primi pochi di questi convergenti sono

3, 14 / 5, 165 / 59, 797 / 285, 4301 / 1538, 89043 / 31841, 279235 / 99852, 29036139 / 10383070 \dots .

$3, 14/5, 165/59, 797/285, 4301/1538, 89043/31841, 279235/99852, 29036139/10383070 \ldots.$

Nell'ultimo caso, una sequenza di 29.036.139 rotoli di a d6produrrà una sequenza di 10.383.070 rotoli di a d150con un tasso di fallimento inferiore a per un'efficienza di distinguibile dal limite asintotico. $2\times 10^{-8},$ $2.79649$

— whuber
fonte

2

Incredibile come sempre, sembra quasi che questa risposta sia stata formattata e preparata anche prima che la domanda fosse posta!

— Łukasz Grad

1

Grazie, @ ŁukaszGrad. Tuttavia, sono innocente di tali macchinazioni e sono sicuro che i lettori con gli occhi acuti troveranno prove della fretta con cui ho scritto questo, per il quale mi scuso in anticipo.

— whuber

Non si dovrebbe anche tenere conto del fatto che quando non è primo, lo spazio campione può essere suddiviso in sottoinsiemi di uguale probabilità? Ad esempio, è possibile utilizzare un d6 come d2 o un d3 e uno spazio campione con 162 elementi - più vicino a 150 di 216 è - è quindi raggiungibile con 4 rotoli, 1d6 + 3d3. (Ciò fornisce gli stessi numero di

d $d$

Ω(d,1) $\Omega(d,1)$

— giri

@Scortchi Descrivi un'impostazione leggermente diversa in cui si ha una scelta di dadi da usare per simulare i disegni da una distribuzione uniforme. Si applica un'analisi simile: potresti trovarlo divertente eseguirlo.

— whuber

7

Nel caso di , tirare tre volte una d6 crea nettamente risultati. $N=150$ $6^3=216$

Il risultato desiderato può essere tabulato in questo modo:

Registra un d6 tre volte in sequenza. Questo produce risultati . Il risultato è uniforme perché tutti i valori di sono ugualmente probabili (i dadi sono equi e trattiamo ogni lancio come distinto). $a,b,c$ $a,b,c$
Sottrai 1 da ciascuno.
Questo è un numero senario: ogni cifra (valore del luogo) va da 0 a 5 con potenze di 6, quindi puoi scrivere il numero in decimale usando $(a - 1) \times 62 + (b - 1) \times 61 + (c - 1) \times 60$ $(a-1) \times 6^2 + (b-1) \times 6^1 + (c-1)\times 6^0$
Aggiungi 1
Se il risultato supera 150, scartare il risultato e rotolare di nuovo.

La probabilità di mantenere un risultato è . Tutti i tiri sono indipendenti e ripetiamo la procedura fino a un "successo" (un risultato in ), quindi il numero di tentativi di generare 1 pareggio tra 1 e 150 viene distribuito come una variabile casuale geometrica, che ha aspettative . Pertanto, l'utilizzo di questo metodo per generare 1 pareggio richiede di tirare in media tiri di dado (poiché ogni tentativo lancia 3 dadi). $p=\frac{150}{216}=\frac{25}{36}$ $1,2,\dots,150$ $p^{-1}=\frac{36}{25}$ $\frac{36}{25}\times 3 =4.32$

Ringraziamo @whuber per averlo suggerito in chat.

— Sycorax dice Reinstate Monica
fonte

Credo che il metodo di Henry non produca una distribuzione uniforme. Questo perché il riciclaggio farà sì che vengano privilegiate alcune cifre. Non ne sono completamente sicuro perché non capisco completamente come il riciclaggio debba essere eseguito.

— whuber

1

@whuber AH! Capisco la tua preoccupazione ora. Ho appena cercato di spiegare a me stesso il processo e ho capito perché la mia intuizione era imperfetta: la probabilità di lanciare un dado aggiuntivo può cambiare l'assegnazione delle probabilità a numeri decimali e renderlo non uniforme perché non sappiamo in anticipo come molti dadi stiamo lanciando.

— Sycorax dice di reintegrare Monica

4

Ecco un'alternativa ancora più semplice alla risposta di Sycorax per il caso in cui . Poiché è possibile eseguire la seguente procedura: $N=150$ $150 = 5 \times 5 \times 6$

Generazione di un numero casuale uniforme da 1 a 150:

Fai tre tiri ordinati di 1D6 e come . $R_1, R_2, R_3$

Se uno dei primi due tiri è un sei, rilanciarlo fino a quando non è 6.

Il numero è un numero uniforme che utilizza la notazione di posizione con una radice di 5-5-6. Pertanto, è possibile calcolare il numero desiderato come: $(R_1, R_2, R_3)$ $X = 30 \cdot (R 1 - 1) + 6 \cdot (R 2 - 1) + (R 3 - 1) + 1.$ $X = 30 \cdot (R_1-1) + 6 \cdot (R_2-1) + (R_3-1) + 1.$

Questo metodo può essere generalizzato a più grande , ma diventa un po 'più imbarazzante quando il valore ha uno o più fattori primi maggiori di . $N$ $6$

— Ripristina Monica
fonte

1

Puoi indicare l'efficienza di questo metodo in termini di numero previsto di tiri per sorteggio generati e chiarire perché il risultato è uniforme su 1,2, ...., 150?

— Sycorax dice di reintegrare Monica

La probabilità di ottenere un risultato che non richiede il re-roll è , che è lo stesso della risposta. Per capire perché è uniforme, nota che stai effettivamente generando un numero uniforme usando la notazione posizionale con radix 5-5-6 (ovvero, l'ultima cifra è l'unità, la penultima cifra è la "sei" e la terza -last cifra è la "trenta").

25/36 $25/36$

— Ripristina Monica

1

Il metodo è effettivamente solo una leggera variazione del metodo nella tua risposta. Nella tua risposta crei un numero uniforme sulla scala numerica 6-6-6 e poi scarti i valori non validi, mentre nella mia risposta scarti prima i valori non validi per generare un numero sulla scala 5-5-6.

— Ripristina Monica

3

+1 In pratica si tratta di un algoritmo accattivante. È interessante e forse suggestivo di un'analisi più ampia, che implementa un automa a stati finiti guidato dai tiri di dado. Ha quattro stati, {Start, A, B, Accept}. Inizia le transizioni verso A dopo aver rotolato 1..5; A passa a B dopo aver rotolato 1..5; e B transizioni per accettare dopo aver fatto rotolare qualcosa. Ogni transizione salva il valore del tiro che lo ha causato, quindi al raggiungimento di Accetta l'output quella sequenza di tre rulli memorizzati e la transizione tornano automaticamente all'inizio.

— whuber

4

Rifiuti spesso quanto @Sycorax, ma fai in media meno tiri. Il previsto no. roll per variabile è .

65+65+1=3.4 $\frac{6}{5} + \frac{6}{5} + 1= 3.4$

— Scortchi - Ripristina Monica

2

Come esempio di un algoritmo per scegliere uniformemente tra valori usando dadi a sei facce, prova questo che usa ogni tiro per moltiplicare i valori disponibili per e rendere ciascuno dei nuovi valori ugualmente probabili: $150$ $6$

Dopo tiri, hai possibilità, non abbastanza per distinguere valori $0$ $1$ $150$
Dopo tiro, hai possibilità, non abbastanza per distinguere valori $1$ $6$ $150$
Dopo tiri, hai possibilità, non abbastanza per distinguere valori $2$ $36$ $150$
Dopo tiri, hai possibilità, abbastanza per distinguere valori ma con valori rimanenti; la probabilità che ti fermi ora è $3$ $216$ $150$ $66$ $\frac{150}{216}$
Se non ti sei fermato, dopo tiri hai possibilità rimanenti, abbastanza per distinguere valori in due modi ma con valori rimanenti; la probabilità che ti fermi ora è $4$ $396$ $150$ $96$ $\frac{300}{1296}$
Se non ti sei fermato, dopo tiri hai possibilità rimanenti, abbastanza per distinguere valori in tre modi ma con valori rimanenti; la probabilità che ti fermi ora è $5$ $576$ $150$ $96$ $\frac{450}{7776}$
Se non ti sei fermato, dopo tiri hai possibilità rimanenti, abbastanza per distinguere valori in cinque modi ma con valori rimanenti; la probabilità che ti fermi ora è $6$ $756$ $150$ $6$ $\frac{750}{46656}$

Se ti trovi su uno dei valori rimanenti dopo tiri, allora ti trovi in una situazione simile alla posizione dopo tiro. Quindi puoi continuare allo stesso modo: la probabilità che ti fermi dopo tiri è $6$ $6$ $1$ $7$ $\frac{0}{279936}$ , dopo $8$ tiri è $\frac{150}{1679616}$ ecc.

Aggiungi questi e scopri che il numero previsto di rotoli necessari è di circa $3.39614$ . Fornisce una selezione uniforme tra $150$ , poiché si seleziona un valore solo in un momento in cui è possibile selezionare ciascuno dei $150$ con uguale probabilità

Sycorax ha chiesto nei commenti un algoritmo più esplicito

In primo luogo, lavorerò in base $6$ con $150_{10}=410_6$
In secondo luogo, anziché i valori target da $1_6$ a $410_6$ , ne sottrarrò uno in modo che i valori target siano compresi tra $0_6$ e $409_6$
Terzo, ogni dado dovrebbe avere valori da $0_6$ a $5_6$ e il lancio di un dado comporta l'aggiunta di una cifra di $6$ cifre sul lato destro del numero generato esistente. I numeri generati possono avere zeri iniziali e il loro numero di cifre è il numero di lanci finora

L'algoritmo è un successivo lancio di dadi:

Lancia i primi tre dadi per generare un numero da $000_6$ a $555_6$ . Poiché $1000_6 \div 410_6 = 1_6 \text{ remainder } 150_6$ prendi il valore generato (che è anche il suo residuo sulla divisione per $410_6$ ) se il valore generato è rigorosamente inferiore a $1000_6-150_6=410_6$ e stop;
Se continui, tira il quarto dado in modo da aver generato un numero da $4100_6$ a $5555_6$ . Poiché $10000_6 \div 410_6 = 12_6 \text{ remainder } 240_6$ si prende il resto del valore generato su divisione per $410_6$ se il valore generato è rigorosamente inferiore a $10000_6-240_6=5320_6$ e si ferma;
Se continui, tira il quinto dado in modo da aver generato un numero da $53200_6$ a $55555_6$ . Poiché $100000_6 \div 410_6 = 123_6 \text{ remainder } 330_6$ si prende il resto del valore generato su divisione per $410_6$ se il valore generato è rigorosamente inferiore a $100000_6-330_6=55230_6$ e stop;
Se continui, tira il sesto dado in modo da aver generato un numero da $552300_6$ a $555555_6$ . Poiché $1000000_6 \div 410_6 = 1235_6 \text{ remainder } 10_6$ prendi il resto del valore generato su divisione per $410_6$ se il valore generato è rigorosamente inferiore a $1000000_6-10_6=555550_6$ e stop;
eccetera.

— Henry
fonte

(+1) Questa risposta sarebbe più chiara se spiegassi come mappare i risultati, per esempio, da 4d6 o 5d6 a 1,2, ..., 150.

— Sycorax dice Reinstate Monica,

@Sycorax - Ora ho fornito una mappatura di base

$6$

— Henry,

1

Le considerazioni sull'entropia indicano che puoi fare sostanzialmente meglio di questo algoritmo. Resta anche da dimostrare che il tuo algoritmo in realtà produce valori distribuiti indipendentemente con distribuzioni uniformi .

— whuber

@whuber - Il mio algoritmo produce esattamente un intero da

possibilità e lo fa in modo uniforme a condizione che i tiri di dado siano uniformi e indipendenti. Ad ogni passo, se raggiunto, è probabile che sia selezionato ciascuno dei

valori. Non produce più valori (a differenza della tua risposta) $150$

$150$

— Henry

1

Ho capito male cosa intendevi, quindi, scrivendo "l'algoritmo è un successivo lancio di dadi". (Avrei dovuto leggere più attentamente.) Nel fare ciò, mi sembra che il tuo algoritmo non produca una distribuzione uniforme, ma non sono sicuro perché non sono stato in grado di capire a cosa è destinato l'algoritmo generale essere. Sarebbe bello vedere una dimostrazione che produce valori uniformi.

— whuber