Tira un dado fino a quando non atterra su un numero diverso da 4. Qual è la probabilità che il risultato sia> 4?


20

Un giocatore riceve un dado a sei facce. Per vincere, deve tirare un numero maggiore di 4 (cioè un 5 o un 6). Se lancia un 4, deve rotolare di nuovo. Quali sono le sue probabilità di vincere?

Penso che la probabilità di vincere , possa essere espressa in modo ricorsivo come:P(W)

P(W)=P(r=5r=6)+P(r=4)P(W)

Ho approssimato come eseguendo 1 milione di prove in Java, in questo modo:0,3999P(W)0.3999

import java.util.Random;
public class Dice {

    public static void main(String[] args) {
        int runs = 1000000000;
        int wins = 0;
        for (int i = 0; i < runs; i++) {
            wins += playGame();
        }
        System.out.println(wins / (double)runs);
    }

    static Random r = new Random();

    private static int playGame() {
        int roll;
        while ((roll = r.nextInt(6) + 1) == 4);
        return (roll == 5 || roll == 6) ? 1 : 0;
    }
}

E vedo che si potrebbe espandere questo modo:P(W)

P(W)=13+16(13+16(13+16))...

Ma non so come risolvere questo tipo di relazione di ricorrenza senza ricorrere a questo tipo di approssimazione. È possibile?


6
Questo è un grande sforzo per impostare la relazione di ricorrenza. Hai buone ragioni per credere che la risposta sia 0.4. Questo è un forte suggerimento che c'è un altro modo di pensare al problema che ti dà la risposta direttamente. Cercalo. La risposta di Geomatt ti porterà lì, il che a sua volta ti aiuterà a capire cosa sta succedendo qui e persino a semplificare altri problemi che incontri più rapidamente senza questo tipo di sforzo. Se un problema apparentemente complicato sembra avere una risposta semplice, dovresti sempre investire il tempo per cercare di capire il perché. Paga enormi dividendi in seguito.
Gioele,

8
Una volta che ti rendi conto che, a causa delle pari probabilità di tutti e sei i risultati e dell'indipendenza dei tiri, non c'è nulla di speciale in alcun risultato particolare di questo esperimento, è ovvio che tutti e cinque i possibili risultati sono ugualmente probabili.
whuber

6
Sono un po 'deluso che nessuno abbia ancora inventato l' assorbente soluzione di Markov Chain :-) Math Stack Exchange ha una nobile tradizione della "soluzione eccessiva" che raramente sembra permeare di Cross Validated ...
Silverfish,

2
È 2/5 scegliere uno dei da quindi la tua simulazione è probabilmente corretta. { 1 , 2 , 3 , 5 , 6 }{5,6}{1,2,3,5,6}
matematico

2
Questo post contro le risposte è quello che immagino siano i data scientist contro gli statistici.
bdeonovic,

Risposte:


47

Basta risolverlo usando l'algebra:

P(W)=26+16P(W)56P(W)=26P(W)=25.

2
Si noti che questo calcolo è valido solo perché la proprietà Markov forte vale per le catene discrete di Markov.
Chill2Macht,

Non ricordo le mie catene discrete di Markov, ma, per semplice matematica, rischierei di voler dire che la relazione di ricorrenza è valida solo a causa della proprietà Strong Markov. Dopo aver stabilito la relazione, stiamo solo risolvendo per x.
josinalvo,

È corretto?
josinalvo,

1
@josinalvo: tecnicamente, la domanda è se P (W) su entrambi i lati dell'equazione significano lo stesso. La proprietà Markov forte implica che lo fanno. In assenza di quella proprietà, P (W) a sinistra significa "la possibilità di vincere con questo tiro" e 1/6 * P (W) a destra significa "la possibilità di vincere dopo aver tirato un 4".
Salterio,

81

Nota: questa è una risposta alla domanda iniziale, piuttosto che alla ricorrenza.

Se ottiene un 4, in pratica non conta, perché il tiro successivo è indipendente. In altre parole, dopo aver tirato un 4 la situazione è la stessa di quando ha iniziato. Quindi puoi ignorare il 4. Quindi i risultati che potrebbero interessare sono 1-3 e 5-6. Ci sono 5 risultati distinti, 2 dei quali stanno vincendo. Quindi la risposta è 2/5 = 0,4 = 40%.


8
Puoi renderlo un po 'più diretto: "Considera il primo lancio che non è un 4. Quindi i risultati ..."
Gioele,

2
Gli occhi della maggior parte delle persone si capovolgono quando vedono tonnellate di matematica, quindi questa mi piace di più. Fondamentalmente stai rimuovendo 4 dai risultati, quindi è 1, 2, 3, 5, 6. Diventa evidente che hai una probabilità del 40% a quel punto.
Nelson,

Ho pensato questo dal titolo, quindi per lo più ho scremato l'intera domanda dopo aver cliccato su di esso. Altrimenti probabilmente mi sarei confuso e avrei indovinato!
GeoMatt22,

1
@Nelson Ho visto più persone i cui occhi si girano quando vedono questo tipo di ragionamento in un problema di probabilità rispetto alle persone i cui occhi si girano quando vedono . p=a+bp
JiK,

Sì. La morale della storia è: non cercare di rendere un problema più difficile di quanto debba essere.
Jay,

14

Le risposte di dsaxton ( /stats//a/232107/90759 ) e GeoMatt22 ( /stats//a/232107/90759 ) forniscono i migliori approcci al problema. Un altro è rendersi conto che la tua espressione

P(W)=13+16(13+16())

È davvero una progressione geometrica :

13+1613+16213+

In generale abbiamo

n=0a0qn=a01q

quindi eccoci qui

P(W)=13116=13:56=615=25.

Naturalmente, il modo per dimostrare la formula generale per la somma di una progressione geometrica, è usare una soluzione algebrica in modo simile a dsaxton.


@William, non credo che il tuo commento sia appropriato per diversi motivi. 1. Non ho mai detto che hai bisogno di serie geometriche per questo. 2. I concetti che usi nella tua risposta sono macchinari molto più pesanti, è ironico dire "non hai bisogno di serie geometriche! Hai solo bisogno della proprietà Markov molto più avanzata e sofisticata". 3. Una soluzione semplice e rigorosa era già fornita da dsaxton. Il tuo metodo è più rotondo e eccessivo per questo problema. 4. L'OP aveva già un'espressione equivalente a una serie geometrica, qualcuno doveva affrontarlo, e potrei anche essere io.
Meni Rosenfeld,

1
@William: In definitiva, la tua risposta è buona, approfondita e un'utile aggiunta alla raccolta di risposte alla domanda. Ciò non significa che dovresti andare ad ogni altra risposta e dire che la tua è molto meglio. Stanno tutti bene. Non tutto deve essere affrontato nel modo più astratto e generale possibile.
Meni Rosenfeld,

È passato un po 'di tempo da quando ero un dottore in matematica, quindi mi scuso se la mia risposta mancava di rigore. (Per favore, non dirmi che si basa sull'assioma della scelta , dato che sarebbe umiliante!) :)
GeoMatt22

3

Tutte le risposte di cui sopra sono corrette, ma non spiegano perché siano corrette e perché è possibile ignorare così tanti dettagli ed evitare di dover risolvere una complicata relazione di ricorrenza.

Il motivo per cui le altre risposte sono corrette è la proprietà Strong Markov , che per una catena Markov discreta equivale alla normale proprietà Markov. https://en.wikipedia.org/wiki/Markov_property#Strong_Markov_property

Fondamentalmente l'idea è che la variabile casuale

τ:=( il numero di volte che il dado non atterra su 4 per la prima volta)

è un tempo di sosta . https://en.wikipedia.org/wiki/Stopping_time Un tempo di arresto è una variabile casuale che non dipende da alcuna informazione futura .

Per dire se il ° tiro di dado è il primo che non è atterrato su un 4 (cioè, al fine di decidere se ), avete solo bisogno di conoscere il valore del rotolo corrente e di tutti i tiri precedenti, ma non quelli futuri, quindi è un tempo di arresto e si applica la proprietà Strong Markov.nτ=nτ

Cosa dice la proprietà Strong Markov? Dice che il numero su cui il dado atterra nel tiro di th, come una variabile casuale, , è indipendente dai valori di TUTTI i tiri precedenti .τXτ

Quindi se il dado tira 4 una volta, due volte, ..., 50 milioni di volte, ..., volte prima di atterrare su un altro valore per il tiro th, non influirà sulla probabilità dell'evento che .τ1τXτ>4

P(Xτ>4|τ=1)=P(Xτ>4|τ=2)==P(Xτ>4|τ=50,000,000)=

Pertanto possiamo supporre, senza perdita di generalità, che . Questa è solo la probabilità che il dado abbia un valore maggiore di 4 dato che non atterra su 4, che possiamo calcolare molto facilmente:τ=1

P(X1>4|X4)=P(X1>4X14)P(X14)=P(X1>4)P(X14)=1356=1365=25
che ovviamente è la risposta corretta.

Puoi leggere di più sui tempi di arresto e sulla proprietà Strong Markov nella Sezione 8.3 della (4a edizione di) Teoria ed esempi di probabilità di Durrett , p. 365.


Per quanto ne so dalla voce della wiki, l'esistenza di un tempo di arresto è necessaria ma non sufficiente per dire che una serie di eventi mostra l'SMP. Scusa se mi manca uno scherzo o un'intuizione profonda, ma perché non presumere che i tiri siano indipendenti e andare avanti con esso?
Jacob Raihle,

@JacobRaihle "Proprietà Markov forte, che per una catena Markov discreta equivale alla normale proprietà Markov." Questo scenario costituisce chiaramente una catena discreta di Markov. I rotoli sono indipendenti, ecco perché è una catena Markov discreta. Il problema è che l'evento "primo tiro che non atterra su 4" non è indipendente dai precedenti, per ragioni che si spera siano ovvie.
Chill2Macht,

È altrettanto chiaro che i rulli sono indipendenti. Quindi quale ulteriore vantaggio offre l'SMP?
Jacob Raihle,

@JacobRaihle Anche se il valore dei rulli è indipendente, il valore del dado la prima volta che atterra su un valore non uguale a 4 NON è indipendente dai valori su cui il dado è atterrato sui rulli precedenti.
Chill2Macht,

Dovrebbe essere, poiché il rotolamento si interrompe non appena ciò accade. Non può esserci un tiro non-4 che non sia anche il primo. E anche se non fosse così, non sono sicuro del tipo di relazione che stai suggerendo.
Jacob Raihle,

1

Un altro modo di vedere il problema.

Consente di chiamare un "risultato reale" un 1,2,3,5 o 6.

Qual è la probabilità di vincere al primo tiro, se hai ottenuto un "risultato reale"? 2/5

Qual è la probabilità di vincere sul secondo lancio, se il secondo lancio è la prima volta che ottieni un "risultato reale"? 2/5

Lo stesso vale per il terzo, il quarto.

Pertanto, è possibile suddividere il campione in (infinte) campioni più piccoli e tutti questi campioni offrono la stessa probabilità.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.