Numero previsto di tiri di dado fino a quando ogni lato non appare 3 volte

15

Qual è il numero previsto di volte in cui devi tirare un dado fino a quando ogni lato non appare 3 volte?

Questa domanda è stata posta nella scuola elementare della Nuova Zelanda ed è stata risolta utilizzando simulazioni. Qual è la soluzione analitica per questo problema?

— Edgar Santos
fonte

6

Poiché i risultati dei tiri sono casuali, non è possibile sapere in anticipo quanti tiri sono necessari. Se la domanda sta cercando, ad esempio, il numero previsto di tiri prima che ogni lato sia apparso 3 volte, questo dovrebbe essere dichiarato esplicitamente. In tal caso, si applica stats.stackexchange.com/tags/self-study/info .

— Juho Kokkala,

3

Di 'a quei ragazzi neozelandesi di leggere Norman L. Johnson, Samuel Kotz, N. Balakrishnan "Distribuzioni multivariate discrete" wiley.com/WileyCDA/WileyTitle/productCd-0471128449.html .

— Mark L. Stone,

3

correlati: Quanto spesso devi tirare un dado a 6 facce per ottenere ogni numero almeno una volta?

— Sycorax dice di reintegrare Monica

28

Supponiamo che tutte le parti $d=6$ abbiano pari possibilità. Generalize e di Let trovare il numero atteso di rotoli necessari fino lato $1$ è apparso $n_1$ volte, parte $2$ è apparso $n_2$ volte, ..., e sul lato $d$ è apparso $n_d$ volte. Poiché le identità dei lati non contano (hanno tutte le stesse possibilità), la descrizione di questo obiettivo può essere condensata: supponiamo che $i_0$ lati non debbano apparire affatto, $i_1$ dei lati devono apparire solo una volta, ... e $i_n$ dei lati devono apparire $n=\max(n_1,n_2,\ldots,n_d)$ volte. Sia

i = (i_{0}, i_{1}, \dots, i_{n})

$\mathbf{i}=(i_0,i_1,\ldots,i_n)$ designare questa situazione e scrivere

e (i)

$e(\mathbf{i})$ per il numero previsto di tiri. La domanda richiede

e (0, 0, 0, 6)

$e(0,0,0,6)$ :

i_{3} = 6

$i_3 = 6$ indica che tutti e sei i lati devono essere visti tre volte ciascuno.

È disponibile una ricorrenza facile. Al tiro successivo, la parte che appare corrisponde a uno dei $i_j$ : che è, o non abbiamo bisogno di vederlo, o abbiamo bisogno di vedere una volta, ..., o abbiamo bisogno di vederlo $n$ più volte. $j$ è il numero di volte in cui abbiamo avuto bisogno di vederlo.

Quando $j=0$ , non abbiamo bisogno di vederlo e non cambia nulla. Questo accade con probabilità $i_0/d$ .
Quando allora abbiamo avuto bisogno di vedere questo lato. Ora c'è un lato in meno che deve essere visto volte e un altro lato che deve essere visto volte. Pertanto, diventa e diventa . Lascia che questa operazione sui componenti di sia designata , in modo che $j \gt 0$ $j$ $j-1$ $i_j$ $i_j-1$ $i_{j-1}$ $i_j+1$ $\mathbf{i}$ $\mathbf{i}\cdot j$

$i \cdot j = (i_{0}, \dots, i_{j - 2}, i_{j - 1} + 1, i_{j} - 1, i_{j + 1}, \dots, i_{n}) .$ $\mathbf{i}\cdot j = (\color{gray}{i_0, \ldots, i_{j-2}}, i_{j-1}+1, i_j-1, \color{gray}{i_{j+1},\ldots, i_n}).$
Questo accade con probabilità . $i_j/d$

Dobbiamo semplicemente contare questo tiro di dado e usare la ricorsione per dirci quanti altri tiri sono previsti. Secondo le leggi di aspettativa e probabilità totale,

e (i) = 1 + \frac{i_{0}}{d} e (i) + \sum_{j = 1}^{n} \frac{i_{j}}{d} e (i \cdot j)

$e(\mathbf{i}) = 1 + \frac{i_0}{d}e(\mathbf{i}) + \sum_{j=1}^n \frac{i_j}{d}e(\mathbf{i}\cdot j)$

(Comprendiamo che ogni volta che , il termine corrispondente nella somma è zero.) $i_j=0$

Se , abbiamo finito ed . Altrimenti possiamo risolvere per , dando la formula ricorsiva desiderata $i_0=d$ $e(\mathbf{i}) =0$ $e(\mathbf{i})$

\begin{matrix} (1) & e (i) = \frac{d + i_{1} e (i \cdot 1) + \dots + i_{n} e (i \cdot n)}{d - i_{0}} . \end{matrix}

$e(\mathbf{i}) = \frac{d + i_1 e(\mathbf{i}\cdot 1) + \cdots + i_n e(\mathbf{i}\cdot n)}{d - i_0}.\tag{1}$

Si noti che è il numero totale di eventi che desideriamo vedere. L'operazione riduce quella quantità di una per ogni fornito , che è sempre il caso. Pertanto questa ricorsione termina a una profondità precisamente (uguale a

| i | = 0 (i_{0}) + 1 (i_{1}) + \dots + n (i_{n})

$|\mathbf{i}| = 0(i_0) + 1(i_1) + \cdots + n(i_n)$

\cdot j

$\cdot j$

j > 0

$j\gt 0$

i_{j} > 0

$i_j \gt 0$

| i |

$|\mathbf{i}|$

nella domanda). Inoltre (come non è difficile verificare) il numero di possibilità per ciascuna profondità di ricorsione in questa domanda è piccolo (mai superiore a

). Di conseguenza, questo è un metodo efficiente, almeno quando le possibilità combinatorie non sono troppo numerose e memorizziamo i risultati intermedi (in modo che nessun valore di

sia calcolato più di una volta).

3 (6) = 18

$3(6) = 18$

8

$8$

e

$e$

Calcolo che

e (0, 0, 0, 6) = \frac{2 286 878 604 508 883}{69 984 000 000 000} \approx 32.677.

$e(0,0,0,6) = \frac{2\,286\,878\,604\,508\,883}{69\,984\,000\,000\,000}\approx 32.677.$

Mi è sembrato terribilmente piccolo, quindi ho eseguito una simulazione (usando R). Dopo oltre tre milioni di lanci di dadi, questo gioco è stato giocato fino al suo completamento oltre 100.000 volte, con una lunghezza media di . L'errore standard di tale stima è : la differenza tra questa media e il valore teorico è insignificante, confermando l'accuratezza del valore teorico. $32.669$ $0.027$

La distribuzione delle lunghezze può essere di interesse. (Ovviamente deve iniziare alle , il numero minimo di tiri necessari per raccogliere tutti e sei i lati tre volte ciascuno.) $18$

# Specify the problem
d <- 6   # Number of faces
k <- 3   # Number of times to see each
N <- 3.26772e6 # Number of rolls

# Simulate many rolls
set.seed(17)
x <- sample(1:d, N, replace=TRUE)

# Use these rolls to play the game repeatedly.
totals <- sapply(1:d, function(i) cumsum(x==i))
n <- 0
base <- rep(0, d)
i.last <- 0
n.list <- list()
for (i in 1:N) {
  if (min(totals[i, ] - base) >= k) {
    base <- totals[i, ]
    n <- n+1
    n.list[[n]] <- i - i.last
    i.last <- i
  }
}

# Summarize the results
sim <- unlist(n.list)
mean(sim)
sd(sim) / sqrt(length(sim))
length(sim)
hist(sim, main="Simulation results", xlab="Number of rolls", freq=FALSE, breaks=0:max(sim))

Implementazione

Sebbene il calcolo ricorsivo di sia semplice, presenta alcune sfide in alcuni ambienti informatici. Il principale tra questi è la memorizzazione dei valori di mentre vengono calcolati. Questo è essenziale, altrimenti ogni valore verrà (ridondante) calcolato un numero molto grande di volte. Tuttavia, l'archiviazione potenzialmente necessaria per un array indicizzato da $e$ $e(\mathbf{i})$ $\mathbf{i}$ potrebbe essere enorme. Idealmente, dovrebbero essere memorizzati solo i valori di effettivamente rilevati durante il calcolo. Ciò richiede una sorta di array associativo. $\mathbf{i}$

Per illustrare, ecco il Rcodice funzionante . I commenti descrivono la creazione di una semplice classe "AA" (array associativo) per la memorizzazione di risultati intermedi. I vettori vengono convertiti in stringhe e quelli vengono utilizzati per indicizzare in un elenco che conterrà tutti i valori. Il $\mathbf{i}$ Eoperazione è implementata come. $\mathbf{i}\cdot j$ %.%

Questi preliminari abilitano la funzione ricorsiva di definire in modo piuttosto semplice in modo da mettere in parallelo la notazione matematica. In particolare, la linea $e$

x <- (d + sum(sapply(1:n, function(i) j[i+1]*e.(j %.% i))))/(d - j[1])

è direttamente paragonabile alla formula sopra. Si noti che tutti gli indici sono stati aumentati di perché inizia a indicizzare le sue matrici su anziché su . $(1)$ $1$ R $1$ $0$

Il tempismo mostra che occorrono secondi per il calcolo ; il suo valore è $0.01$ e(c(0,0,0,6))

32,6771634160506

L'errore di arrotondamento in virgola mobile accumulato ha distrutto le ultime due cifre (che dovrebbero essere 68anziché 06).

e <- function(i) {
  #
  # Create a data structure to "memoize" the values.
  #
  `[[<-.AA` <- function(x, i, value) {
    class(x) <- NULL
    x[[paste(i, collapse=",")]] <- value
    class(x) <- "AA"
    x
  }
  `[[.AA` <- function(x, i) {
    class(x) <- NULL
    x[[paste(i, collapse=",")]]
  }
  E <- list()
  class(E) <- "AA"
  #
  # Define the "." operation.
  #
  `%.%` <- function(i, j) {
    i[j+1] <- i[j+1]-1
    i[j] <- i[j] + 1
    return(i)
  }
  #
  # Define a recursive version of this function.
  #
  e. <- function(j) {
    #
    # Detect initial conditions and return initial values.
    #
    if (min(j) < 0 || sum(j[-1])==0) return(0)
    #
    # Look up the value (if it has already been computed).
    #
    x <- E[[j]]
    if (!is.null(x)) return(x)
    #
    # Compute the value (for the first and only time).
    #
    d <- sum(j)
    n <- length(j) - 1
    x <- (d + sum(sapply(1:n, function(i) j[i+1]*e.(j %.% i))))/(d - j[1])
    #
    # Store the value for later re-use.
    #
    E[[j]] <<- x
    return(x)
  }
  #
  # Do the calculation.
  #
  e.(i)
}
e(c(0,0,0,6))

Infine, ecco l' implementazione originale di Mathematica che ha prodotto la risposta esatta. La memorizzazione viene effettuata tramite l' e[i_] := e[i] = ...espressione idiomatica , eliminando quasi tutti i Rpreliminari. Internamente, però, i due programmi stanno facendo le stesse cose allo stesso modo.

shift[j_, x_List] /; Length[x] >= j >= 2 := Module[{i = x},
   i[[j - 1]] = i[[j - 1]] + 1;
   i[[j]] = i[[j]] - 1;
   i];
e[i_] := e[i] = With[{i0 = First@i, d = Plus @@ i},
    (d + Sum[If[i[[k]] > 0, i[[k]]  e[shift[k, i]], 0], {k, 2, Length[i]}])/(d - i0)];
e[{x_, y__}] /; Plus[y] == 0  := e[{x, y}] = 0

e[{0, 0, 0, 6}]

$\frac{2286878604508883}{69984000000000}$

— whuber
fonte

5

+1 Immagino che una parte della notazione sarebbe difficile da seguire per gli studenti a cui è stata posta questa domanda (non che io abbia qualche alternativa concreta da suggerire in questo momento). D'altra parte, mi chiedo che cosa intendessero fare con una domanda del genere.

— Glen_b -Restate Monica

1

@Glen_b Potrebbero imparare molto tirando i dadi (e calcolando i risultati). Sembra un buon modo per tenere una lezione occupata per mezz'ora mentre l'insegnante riposa :-).

— whuber

12

La versione originale di questa domanda ha iniziato la sua vita chiedendo:

quanti tiri sono necessari fino a quando ogni lato non appare 3 volte

$\rightarrow$ Perché no? Il problema si riduce a 1 liner.

Distribuzione del numero di rotoli richiesti ... in modo tale che ogni lato appaia 3 volte

$n$ $X_i$ $i$ $i \in \{1, \dots, 6\}$ . Then, the joint pmf of $(X_1, X_2,\dots, X_6)$ is $\text{Multinomial}(n,\frac16)$ i.e.:

P (X_{1} = x_{1}, \dots, X_{6} = x_{6}) = \frac{n!}{x_{1}! \dots x_{6}!} \frac{1}{6^{n}} subject to: \sum_{i = 1}^{6} x_{i} = n

$P\left(X_1=x_1,\ldots ,X_6=x_6\right) \; = \; \frac{n! }{ x_1! \cdots x_6!} \; \frac{1}{6^n} \quad \text{ subject to: } \quad \sum _{i=1}^6 x_i=n$

Let: $\quad N = \min\big\{n: \; {X_i \geq 3 \; \forall_i } \big\}. \;$ Then the cdf of $N$ is: $\quad P(N \leq n) \; = \; P\big(X_{\forall_i} \geq 3 \; \big| \; n\big)$

i.e. To find the cdf $P(N \leq n)$ , simply calculate for each value of $n = \{18, 19, 20,\dots\}$ :

P (X_{1} \geq 3, \dots, X_{6} \geq 3) where (X_{1}, \dots, X_{6}) \sim Multinomial (n, \frac{1}{6})

$P(X_1 \geq3, \dots , X_6 \geq 3) \quad \text{ where } \quad (X_1, \dots, X_6) \sim \text{Multinomial}(n,\frac16)$

Here, for example, is Mathematica code that does this, as $n$ increases from 18 to say 60. It is basically a one-liner:

 cdf = ParallelTable[ 
   Probability[x1 >= 3 && x2 >= 3 && x3 >= 3 && x4 >= 3 && x5 >= 3 &&  x6 >= 3, 
       {x1, x2, x3, x4, x5, x6} \[Distributed] MultinomialDistribution[n, Table[1/6, 6]]],
    {n, 18, 60}]

... which yields the exact cdf as $n$ increases:

\begin{array}{cc} 18 & \frac{14889875}{11019960576} \\ 19 & \frac{282907625}{44079842304} \\ 20 & \frac{3111983875}{176319369216} \\ 21 & \frac{116840849125}{3173748645888} \\ 22 & \frac{3283142988125}{50779978334208} \\ 23 & \frac{61483465418375}{609359740010496} \\ ⋮ & ⋮ \end{array}

$\begin{array}{cc} 18 & \frac{14889875}{11019960576} \\ 19 & \frac{282907625}{44079842304} \\ 20 & \frac{3111983875}{176319369216} \\ 21 & \frac{116840849125}{3173748645888} \\ 22 & \frac{3283142988125}{50779978334208} \\ 23 & \frac{61483465418375}{609359740010496} \\ \vdots & \vdots\\ \\ \end{array}$

Here is a plot of the cdf $P(N\leq n)$ , as a function of $n$ :

To derive the pmf $P(N=n)$ , simply first difference the cdf:

Of course, the distribution has no upper bound, but we can readily solve here for as many values as practically required. The approach is general and should work just as well for any desired combination of sides required.

— wolfies
fonte