Problema di Monty Hall con un Fallible Monty


23

Monty sapeva perfettamente se la Porta aveva una capra (o era vuota). Questo fatto consente al giocatore di raddoppiare la sua percentuale di successo nel tempo, passando "ipotesi" sull'altra porta. E se la conoscenza di Monty fosse stata meno che perfetta? E se a volte il Premio fosse davvero sulla stessa porta della capra? Ma non hai potuto vederlo fino a quando non hai scelto e aperto la TUA porta? Potete per favore aiutarmi a capire come calcolare IF - e di quanto - Il giocatore può migliorare il suo successo quando il tasso di accuratezza di Monty è inferiore al 100%? Ad esempio: cosa succede se Monty ha torto, in media il 50% delle volte? Il giocatore può ANCORA trarre vantaggio dal cambio della sua ipotesi / porta? Immagino che se Monty ha meno del 33,3% di probabilità di essere corretto che il Premio NON è dietro la Porta, l'opzione migliore per il Giocatore è NON cambiare la sua scelta. Potete per favore fornirmi un modo per calcolare il potenziale vantaggio del passaggio inserendo diverse probabilità che Monty sia corretto sul fatto che il premio NON sia dietro la porta? Non ho nulla al di là della matematica del liceo e ho 69 anni, quindi per favore sii gentile.


Grazie per gli approfondimenti e le formule fornite. Sembra che se "Fallible Monty" è preciso solo al 66% nel prevedere l'assenza di un premio / automobile, si ha un vantaggio ZERO nel passaggio dalla scelta originale delle porte .... perché il suo tasso di errore del 33% è l'impostazione predefinita la tariffa base per il Premio è dietro QUALSIASI porta. Si presume, tuttavia, che IF Monty migliori del 66% nel prevedere dove non vi è PREMIO, quindi la commutazione deriva una maggiore utilità. Cercherò di applicare questo ragionamento a un gioco in cui un "Esperto" fa una "previsione dell'esperto" che una delle tre opzioni approssimativamente ugualmente probabili sarà quella corretta. Ho poca fiducia nel fatto che l'Esperto sia corretto e sono abbastanza certo che il suo "tasso di successo" sarà inferiore al 33%, più simile al 15%. La mia conclusione da ciò sarà che quando il "stessa opzione, probabilmente mi sbaglio di sicuro, e dovrei cambiare in uno degli altri due! ;-)


5
Se la precisione di Monty è inferiore al 100%, significa che a volte apre la porta con il premio dietro? In tal caso, dovresti probabilmente scegliere quella porta.
Fax

Risposte:


35

Cominciamo con il normale problema di Monty Hall. Tre porte, dietro una delle quali c'è un'auto. Le altre due hanno capre dietro di loro. Scegli la porta numero 1 e Monty apre la porta numero 2 per mostrarti che c'è una capra dietro quella. Dovresti passare a indovinare la porta numero 3? (Nota che i numeri che usiamo per fare riferimento a ciascuna porta non contano qui. Potremmo scegliere qualsiasi ordine e il problema è lo stesso, quindi per semplificare le cose possiamo semplicemente usare questa numerazione.)

La risposta ovviamente è sì, come già sapete, ma passiamo attraverso i calcoli per vedere come cambiano in seguito. Sia C l'indice della porta con l'auto e M denota l'evento in cui Monty ha rivelato che la porta 2 ha una capra. Dobbiamo calcolare p(C=3|M) . Se questa è la più grande di 1/2 , abbiamo bisogno di cambiare la nostra supposizione a quella porta (dal momento che abbiamo solo due opzioni rimanenti). Questa probabilità è data da:

p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
(Questo sta solo applicando la regola di Bayes con un piano precedente aC)p(M|C=3)è uguale a 1: se l'auto è dietro la porta numero 3, Monty non ha avuto altra scelta che aprire la porta numero 2 come ha fatto lui. p(M|C=1)uguale a1/2 : se l'auto si trova dietro la porta 1, Monty poteva scegliere di aprire una delle porte rimanenti, 2 o 3.p(M|C=2) uguale a 0, perché Monty non apre mai la porta che sa che ha il auto. Compilando questi numeri, otteniamo:
p(C=3|M)=10.5+0+1=23
Qual è il risultato che conosciamo.

Consideriamo ora il caso in cui Monty non ha una conoscenza perfetta di quale porta ha l'auto. Quindi, quando sceglie la sua porta (di cui continueremo a fare riferimento come porta numero 2), potrebbe accidentalmente scegliere quello con la macchina, perché pensa che abbia una capra. Sia C la porta che Monty pensa abbia la macchina, e sia p(C|C) la probabilità che egli pensi che la macchina sia in un determinato posto, subordinata alla sua posizione effettiva. Supponiamo che ciò sia descritto da un singolo parametro q che determina la sua precisione, in modo tale che: p(C=x|C=x)=q=1p(Cx|C=x)è 1 / 3 , le informazioni di Monty non è meglio di indovinare a caso è. . Seq uguale a 1, Monty ha sempre ragione. Seq è 0, Monty ha sempre torto (che è ancora informativo). Seq1/3

Ciò significa che ora abbiamo:

p(M|C=3)=xp(M|C=x)p(C=x|C=3)
= p ( M | C = 1 ) p ( C = 1 | C = 3 = 2 ) p ( C = 2 | C =
=p(M|C=1)p(C=1|C=3)+p(M|C=2)p(C=2|C=3)+p(M|C=3)p(C=3|C=3)
=12×12(1q)+0×12(1q)+1×q
=14q4+q=34q+14

Cioè, se l'auto fosse davvero dietro la porta 3, ci sarebbero state tre possibilità che avrebbero potuto essere giocate: (1) Monty pensava che fosse dietro 1, (2) Monty pensato 2 o (3) Monty pensato 3. L'ultima opzione si verifica con probabilità q (quanto spesso lo capisce bene), gli altri due dividono la probabilità di sbagliare (1q) tra di loro. Quindi, dato ogni scenario, qual è la probabilità che avrebbe scelto di indicare la porta numero 2, come ha fatto? Se avesse pensato che l'auto fosse dietro 1, quella probabilità era 1 su 2, dato che avrebbe potuto scegliere 2 o 3. Se avesse pensato che fosse dietro 2, non avrebbe mai scelto di puntare a 2. Se avesse pensato che fosse dietro 3 , avrebbe sempre scelto 2.

Allo stesso modo possiamo calcolare le restanti probabilità:

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12q2=12

p(M|C=2)=xp(M|C=x)p(C=x|C=2)
=12×12(1q)+1×12(1q)
=3434q

Compilando tutto questo, otteniamo:

p(C=3|M)=34q+1412+3434q+34q+14
=0.75q+0.251.5
Come controllo di integrità, quando q=1 , possiamo vedere che otteniamo la risposta originale di11.5=23 .

Quindi, quando dovremmo cambiare? Presumo per semplicità che non ci sia permesso di passare alla porta a cui Monty indicava. E in effetti, fintanto che Monty è almeno in qualche modo corretto (più che un'ipotesi casuale), la porta a cui punta sarà sempre meno probabile che le altre abbiano l'auto, quindi questa non è un'opzione praticabile per noi comunque. Quindi dobbiamo solo considerare le probabilità delle porte 1 e 3. Ma mentre era impossibile per l'auto essere dietro la porta 2, questa opzione ora ha probabilità diverse da zero e quindi non è più il caso che dovremmo cambiare quando p(C=3|M)>0.5 , ma piuttosto dovremmo cambiare quandop(C=3|M)>p(C=1|M) (che era la stessa cosa). Questa probabilità è data dap(C=1|M)=0.51.5=13 , come nel problema originale di Monty Hall. (Ciò ha senso dal momento che Monty non può mai indicare la porta 1, indipendentemente da ciò che sta dietro, e quindi non può fornire informazioni su quella porta. Piuttosto, quando la sua precisione scende al di sotto del 100%, l'effetto è che una certa probabilità "perde" verso la porta 2 effettivamente avendo l'auto.) Quindi, dobbiamo trovareqtale chep(C=3|M)>13 :

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
Quindi, in sostanza, questo è stato un modo molto lungo per scoprire che, fintanto che la conoscenza di Monty sulla posizione reale dell'auto è migliore di un'ipotesi casuale, dovresti cambiare portiera (che in realtà è un po 'ovvio, quando pensi a esso). Possiamo anche calcolare quante più probabilità abbiamo di vincere quando cambiamo, in funzione dell'accuratezza di Monty, dato che è dato da:
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
(Che, quandoq=1 , dà una risposta di 2, corrispondente al fatto che raddoppiamo le nostre possibilità di vincita cambiando porta nel problema originale di Monty Hall.)

Modifica: le persone chiedevano dello scenario in cui ci è permesso di passare alla porta a cui punta Monty, il che diventa vantaggioso quando q<13 , ovvero quando Monty è un "bugiardo" (piuttosto) affidabile. Nello scenario più estremo, quandoq=0 , questo significa che la porta Monty pensa che l'auto abbia effettivamente una capra. Si noti, tuttavia, che le restanti due porte potrebbero avere ancora un'auto o una capra.

Il vantaggio di passare alla porta 2 è dato da:

p(C=2|M)p(C=1|M)=0.750.75q1.513=1.51.5q
Che è solo maggiore di 1 (e quindi vale la pena passare a quella porta) se1.5q<0.5, ovvero seq<13 , che abbiamo già stabilito era il punto di svolta. È interessante notare che il massimo vantaggio possibile per passare alla porta 2, quandoq=0, è solo 1,5, rispetto a un raddoppio delle probabilità di vincita nel problema originale di Monty Hall (quandoq=1).

La soluzione generale è data dalla combinazione di queste due strategie di commutazione: quando q>13 , si passa sempre alla porta 3; in caso contrario, passare alla porta 2.


Il valore atteso non potrebbe effettivamente tornare indietro quando q < 1/3, poiché non sta modellando la probabilità che sia accurata, sta modellando la probabilità che abbia torto? Man mano che si avvicina a 0 significherebbe che mentirà sempre, se possibile, e le tue vincite attese tornerebbero a 2/3
Cireo,

2
@Cireo Non mentirebbe, si sbaglierebbe semplicemente. Mentire lo implicherebbe sapendo che la sua risposta era sbagliata. Ho il sospetto che il motivo per cui il valore atteso non ritorni su sia perché la possibilità che lui punti accidentalmente verso la porta con l'auto dietro di essa (cioè, p (M | C = 2) sta salendo) e non puoi scegliere quella porta, non importa quale). q = 0 significa che ricorda sempre dove si trova la macchina, vale a dire che ora c'è una probabilità relativamente alta che indichi la portiera con la macchina dietro di essa.
Buurman,

3
Una soluzione più generale (di cui ovviamente ha bisogno) include un Monty "ostile"; uno che cambia ciò che indica (o anche se indica qualcosa) a seconda che tu abbia scelto una capra o un'auto.
Yakk,

3
@Yakk: ci sono infiniti altri scenari che puoi immaginare che cambiano le probabilità in infiniti modi. Dipende anche se sai come funziona Monty. Se sai che è ostile, in realtà non può ridurre le tue probabilità al di sotto di 1/3, perché deciderai di ignorare qualunque cosa faccia. Se non conosci il suo processo decisionale, dipende totalmente da cosa pensi e da cosa fa esattamente, e ci sono molti gradi di libertà lì.
Ruben van Bergen,

1
q=0

7

Questa dovrebbe essere una variazione abbastanza semplice del problema (anche se noto il tuo background matematico limitato, quindi immagino che sia relativo). Suggerirei prima di provare a determinare la soluzione base al fatto che Monte sia infallibile o completamente fallibile. Il primo caso è proprio il normale problema di Monte Hall, quindi non è necessario alcun lavoro. Nel secondo caso, tratteresti la porta che sceglie come casuale su tutte le porte, inclusa la porta con il premio (cioè, potrebbe ancora scegliere una porta senza premio, ma ora è casuale). Se riesci a calcolare la probabilità di una vittoria in ciascuno di questi casi, puoi usare la legge della probabilità totale per determinare le probabilità di vincita rilevanti nel caso in cui Monte abbia un determinato livello di fallibilità (specificato da una probabilità che siamo infallibili contro completamente fallibili).


2
Apprezzo la risposta, ma stavo cercando qualcosa di più specifico. Sto specificando che Monty ha scelto una porta. Sto specificando che la probabilità che il Premio si trovi dietro quella porta potrebbe variare da zero al 100%. Speravo in una formula che mi permettesse di inserire semplicemente la probabilità che Monty fosse giusto / sbagliato e quindi elaborare il resto della formula avrebbe fornito una stima numerica che indica la probabilità che Switching comporti una vincita. Quel grado di assistenza è una richiesta non realistica?
Pseudoego,

4

Sulla base dei commenti sulla risposta di Ben, offrirò due diverse interpretazioni di questa variante di Monty Hall, diversa da quella di Ruben van Bergen.

Il primo che chiamerò Liar Monty e il secondo Unreliable Monty. In entrambe le versioni il problema procede come segue:

(0) Ci sono tre porte, dietro una delle quali è una macchina e dietro le altre due sono le capre, distribuite in modo casuale.

(1) Il concorrente sceglie una porta a caso.

(2) Monty sceglie una porta diversa da quella del concorrente e afferma che dietro c'è una capra.

(3) Al concorrente viene offerto di passare alla terza porta non selezionata, e il problema è "Quando il concorrente dovrebbe cambiare per massimizzare la probabilità di trovare un'auto dietro la porta?"

In Liar Monty, al punto (2), se il concorrente ha scelto una porta contenente una capra, Monty sceglie una porta contenente l'auto con una probabilità predefinita (cioè c'è una probabilità tra 0 e 100% che mentirà che un la capra è dietro qualche porta). Nota che in questa variante, Monty non sceglie mai una porta contenente l'auto (cioè non può mentire) se il concorrente ha scelto l'auto nel passaggio (1).

2313

Per rispondere al problema, dovremo usare alcune equazioni. Proverò a pronunciare la mia risposta in modo che sia accessibile. Le due cose che spero non siano troppo confuse sono la manipolazione algebrica dei simboli e la probabilità condizionata. Per il primo, useremo i simboli per indicare quanto segue:

S=The car is behind the door the contestant can switch to.S¯=The car is not behind the door the contestant can switch to.M=The car is behind the door Monty chose.M¯=The car is not behind the door Monty chose.C=The car is behind the door the contestant chose in step (1).C¯=The car is not behind the door the contestant chose in step (1).

Pr()Pr(M¯) significhi la probabilità che l'auto non sia dietro la porta scelta da Monty. (Vale a dire ovunque vedi un'espressione che coinvolge i simboli, sostituisci i simboli con gli equivalenti "inglesi".)

Richiederemo anche una comprensione rudimentale della probabilità condizionale, che è approssimativamente la probabilità che qualcosa accada se si ha conoscenza di un altro evento correlato. Questa probabilità sarà rappresentata qui da espressioni comePr(S|M¯)|Pr(S|M¯)Pr(S|M¯)=23Pr(S)=13, which corresponds to the case when Monty has not given you any information.

I will now demonstrate that Unreliable Monty is equivalent to Liar Monty. In Liar Monty, we are given the quantity Pr(M|C¯), the probability that Monty will lie about his door, knowing that the contestant has not chosen the car. In Unreliable Monty, we are given the quantity Pr(M), the probability that Monty lies about his door. Using the definition of conditional probability Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯), and rearranging, we obtain:

Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)32Pr(M)=Pr(M|C¯),
since Pr(C¯), the probability that the car is not behind the contestant's chosen door is 23 and Pr(C¯|M), the probability that the car is not behind the contestant's chosen door, if we know that it is behind Monty's door, is one.

Thus, we have shown the connection between Unreliable Monty (represented by LHS of the above equation) and Liar Monty (represented by the RHS). In the extreme case of Unreliable Monty, where Monty chooses a door that hides the car 23 of the time, this is equivalent to Monty lying all the time in Liar Monty, if the contestant has picked a goat originally.

Having shown this, I will now provide enough information to answer the Liar version of the Monty Hall Problem. We want to calculate Pr(S). Using the law of total probability:

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
since Pr(S|C)=Pr(S|C¯ and M)=0 and Pr(S|C¯ and M¯)=1 (convince yourself of this!).

Continuing:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

So you see, when Monty always lies (aka Pr(M|C¯))=1) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S), is 23.

From this you can work out the optimal strategies for both Liar, and Unreliable Monty.

Addendum 1

In response to comment (emphasis mine):

"I added more details in my comment to @alex - Monty is never hostile nor devious, just FALLIBLE, as sometimes he can be wrong for whatever reasons, and never actually opens the door. Research shows that Monty is wrong roughly 33.3% of the time, and the car actually turns out to be there. That is a Posterior Probability of being correct 66.6% of the time, correct? Monty never chooses YOUR door, and you will never choose his. Do these assumptions change anything?"

This is as I understand, the Unreliable Monty Hall Problem introduced at the start of my answer.

Therefore, if Monty's door contains the car 13 of the time, we have the probability of winning when you switch to the last unpicked door as:

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)


Alex and @Ruben van Bergen et al Thanks for the helpful details. Assume Monty's never hostile, just fallible and tells you "I am pretty sure that the the Car is NOT behind this door." but does not open the door. Let's assume Research shows he is WRONG only about 33.3% of the time, thus correct 66.6% (a Posterior Probability?). There is still some benefit to switching, but once his accuracy reaches only 33.3% then it would make NO sense to switch to either HIS door or the other one. Literally a case of "your guess is as good as mine." Does any of this change your Analyses or Formulae?
Pseudoego

No, this doesn't change my analysis. I added something which I hope clarifies the question in your comment. Btw, I wouldn't read too much into the words "hostile", "fallible", "monty lies". These don't really mean anything unless defined with precision as the (conditional) probability that Monty is wrong about a door containing a goat.
Alex

Pretty annoyed that my OWN answer to MY OWN question would be deleted with the only explanation given is that this site is not for "discussion" - when I am mainly explaining why I think the Answers given so far are Correct, and explaining how they will be useful. There was far more discussion in most of the other answers given. This seems myopic to me - at best - and moronic - at worst - to delete somebody's answer to their own question: how can you possibly explain WHY you are rating an Answer as the BEST without discussing it? Thanks to all who replied regardless.
Pseudoego

@Pseudoego your last comment is better post as a comment on your original question. I didn't see your answer, but it sounds like you want to discuss the existing answers, in which case you can modify your original question.
Alex

0

For some reason, a moderator decided to delete my own answer to my own question, on the grounds that it contained "discussion." I don't really see HOW I can explain what is the Best Answer without discussing what makes it work for me, and how it can be applied in practice.

I appreciate the insights and formulae which were provided in the previous answers. It appears to be that IF "Fallible Monty" is only 66% accurate in predicting the absence of a Prize/Car THEN there is ZERO benefit to switching from your original choice of doors....because his 33% error rate is the default base rate for the Prize being behind ANY door. One assumes, though, that IF Monty gets better than 66% at predicting where there is NO PRIZE THEN switching derives greater Utility.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.