Il paradosso dei prigionieri


11

Mi viene dato un esercizio e non riesco proprio a capirlo.

Il paradosso del prigioniero

Tre prigionieri in isolamento, A, B e C, sono stati condannati a morte lo stesso giorno ma, a causa di una festa nazionale, il governatore decide che verrà concesso un perdono. I prigionieri ne sono informati, ma hanno detto che non sapranno chi di loro dovrà essere risparmiato fino al giorno previsto per le esecuzioni.

Il prigioniero A dice al carceriere "So già che almeno uno degli altri due prigionieri saranno giustiziati, quindi se mi dici il nome di uno che verrà giustiziato, non mi avrai dato alcuna informazione sulla mia stessa esecuzione" .

Il carceriere accetta questo e gli dice che C morirà sicuramente.

A allora ragioni “Prima di sapere che C doveva essere giustiziato, avevo una possibilità su 3 di ricevere un perdono. Ora so che sia B che me stesso saranno perdonati, le probabilità sono migliorate a 1 su 2. ”.

Ma il carceriere sottolinea "Avresti potuto raggiungere una conclusione simile se avessi detto che B morirà e che sarei tenuto a rispondere a B o C, quindi perché hai dovuto chiedere?".

Quali sono le possibilità di A di ricevere un perdono e perché? Costruisci una spiegazione che possa convincere gli altri che hai ragione.

Potresti affrontarlo con il teorema di Bayes, disegnando una rete di credenze o di buon senso. Qualunque approccio tu scelga, dovrebbe approfondire la tua comprensione del concetto ingannevolmente semplice di probabilità condizionale.

Ecco la mia analisi:

Sembra il problema della Monty Hall , ma non del tutto. Se A dice I change my place with Bdopo che gli è stato detto che C morirà, ha 2/3 possibilità di essere salvato. Se non lo fa, direi che le sue possibilità sono 1/3 di vivere, come quando non cambi la tua scelta nel problema di Monty Hall. Ma allo stesso tempo, è in un gruppo di 2 ragazzi e uno dovrebbe morire, quindi è allettante dire che le sue possibilità sono 1/2.

Quindi il paradosso è ancora qui, come affronteresti questo. Inoltre, non ho idea di come fare una rete di credenze su questo, quindi sono interessato a vederlo.


2
"Fa parte di un gruppo di 2 ragazzi" non implica "le sue possibilità sono 1/2"
Henry,

Risposte:


8

Inizialmente ci sono tre possibilità con pari probabilità:

  • A verrà liberato (prob )1/3
  • B sarà liberato (prob )1/3
  • C sarà liberato (prob )1/3

Con la promessa del messaggio, ci sono quattro possibilità con diverse probabilità:

  • A verrà liberato e A verrà informato B verrà eseguito (prob )1/6
  • A verrà liberato e A verrà informato C verrà eseguito (prob )1/6
  • B verrà liberato e A verrà informato C verrà eseguito (prob )1/3
  • C verrà liberato e A verrà informato B verrà eseguito (prob )1/3

A condizione che "A venga detto che C verrà eseguito" questo diventa

  • A verrà liberato e A verrà informato C verrà eseguito (prob )1/3
  • B verrà liberato e A verrà informato C verrà eseguito (prob )2/3

Quindi, dopo che il messaggio A vorrebbe scambiare con B (il problema di Monty Hall), ma non può e mantiene così la probabilità originale di essere eseguita.2/3


1
A vorrebbe scambiare con B è la chiave. Per prendere una delle spiegazioni comuni di Monty Hall: Immagina che ci siano 1000 prigionieri: A chiede al carceriere che gli dà 998 nomi. Chiaramente abbiamo appena imparato molto sull'unico che non è A e che non ha un nome . Ma non abbiamo imparato nulla di A .
Ben Jackson,

Penso che nella posizione di A sia un'ottima strategia per lui chiedere alla guardia questo. Quindi, parla con B e chiedi se vuole cambiare. Se è d'accordo, voi ragazzi potete chiedere ai carnefici se, se uno di loro deve essere liberato, quindi liberare l'altro. Dal punto di vista di B, le sue probabilità non cambiano, quindi non c'è motivo per lui di dire di no (o di dire di sì, quindi è una questione di pressione a quel punto)
Cruncher

8

Penso che tu stia pensando troppo al problema: è un problema di Monty Hall e si applica la stessa logica.


Puoi sviluppare? Sono interessato al ragionamento, non alla risposta
Benjamin Crouzier,

1
@pinouchon: The Jailer è Monty Hall e Prisoner A è il giocatore. Morire è analogo all'ottenere una capra; essere graziati è analogo all'ottenere un premio. Ora puoi tradurre direttamente qualsiasi spiegazione del problema di Monty Hall che ti piace: copre un sacco di ragionamenti. +1 a babelproofreader per averlo segnalato.
whuber

Come si argomentare contro questa dichiarazione: But at the same time, he is in a group of 2 guys, and one should die, so it is tempting to say that his chances are 1/2.. E la rete di credenze?
Benjamin Crouzier,

1
@Pinouchon Sarebbe costruttivo modificare la tua domanda per concentrarti sull'aspetto della rete di credenze. Lo stesso problema di Monty Hall è stato discusso a morte in molti, molti posti, quindi non vedo alcun motivo per ripassare quel materiale qui.
whuber

Concordo sul fatto che il problema di Monty Hall sia stato discusso a morte ma, nonostante le affermazioni di babelproof e whuber, non vedo dove il prigioniero A possa cambiare posto. Se il carceriere aveva tre buste sigillate, una contenente un perdono e due contenenti condanne a morte, A ne prese una busta e il carceriere ne aprì un'altra (esattamente le stesse regole che ho dato in una risposta separata) e mostrò che conteneva una condanna a morte, e poi chiese A "Ti piacerebbe conservare la busta che hai scelto o preferiresti cambiare?" Riesco a vedere l'analogia
Dilip Sarwate,

3

Non sono del tutto sicuro di essere d'accordo con @babelproofreader sul fatto che si tratta di un problema di Monty Hall e si applica la stessa logica. Nel problema di Monty Hall, scendi e selezioni una porta. Le regole sono che Monty sa dove si trova il premio, non aprirà mai una porta che nasconde il premio e aprirà sempre una delle porte non scelte (cioè se hai scelto una porta senza un premio, non aprirà la porta che hai scelto e dire "Mi dispiace, tu perdi!" e ti rimanderà al tuo posto), e ti offrirà sempre la possibilità di passare all'altra porta (non aperta non aperta) (cioè non offrirà la scelta solo quando hai scelto la porta con il premio.) In queste circostanze, se indica l'evento in cui la tua scelta iniziale è la porta con il premio, allora . SeAP(A)=13B è l'evento in cui la tua scelta finale è la porta con il premio, quindi

  • se la tua strategia è quella di rimanere sempre fermo , allora (poiché hai fatto la scelta giusta all'inizio e stai rispettando) e (perché tu fatto una scelta sbagliata all'inizio e ci atteniamo). Quindi, secondo la legge della probabilità totale, P(BA)=1P(BAc)=0
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=1×13+0×23=13
  • se la tua strategia è di cambiare sempre , allora (poiché hai fatto la scelta giusta all'inizio e poi cambiato) e (perché hai sbagliato scelta all'inizio e quindi la restante porta (non aperta non aperta) è garantita per avere il premio). Quindi secondo la legge della probabilità totale, P(BA)=0P(BAc)=1
    P(B)=P(BA)P(A)+P(BAc)P(Ac)=0×13+1×23=23

Qui , la situazione è diversa. Non v'è alcun luoghi cambiano con come in "Se A dice che cambiare il mio posto con B dopo gli viene detto C morirà, ha 2/3 possibilità di essere salvati." B

Commenti aggiunti: Un'altra differenza è che A non ha informazioni sul fatto che il carceriere sappia chi sarà graziato o se il carceriere sta dicendo la verità quando dice che C sarà giustiziato. D'altra parte, il carceriere ha perfettamente ragione quando osserva che il suo dire A che C sarà eseguito non ha fornito informazioni utili ad A. L'analogia più vicina al problema di Monty Hall è che dopo che A ha scelto una porta, Monty apre un non ha scelto la porta per rivelare una capra e dice a "Apri la tua porta e vediamo cosa hai ", cioè nessuna offerta di un interruttore. Quindi la possibilità di A di vincere il premio (Monty Hall) o di essere perdonato (problema del prigioniero) è la stessa: su13 indipendentemente dal fatto che Monty apra una porta non scelta per rivelare una capra o no, o il carceriere dice ad A che C sarà eseguita, o no, esattamente come Henry ha calcolato in dettaglio.


Penso che possiamo supporre che il carceriere abbia tali informazioni, altrimenti il ​​problema non vale la pena di ragionare (se il carceriere ha una probabilità sconosciuta di mentire, allora potrebbe anche non aver detto nulla). Per quanto riguarda il tuo primo punto: certo, il risultato è diverso rispetto al problema di Monty Hall perché non esiste alcuna opzione per passare. Ma la logica è la stessa: rivelando un'opzione che non è un vincitore, vengono fornite informazioni su un'altra opzione che il carceriere / Monty avrebbe potuto scegliere.
Ruben van Bergen,

2

La risposta dipende da come il carceriere sceglie quale prigioniero nominare quando sa che A deve essere graziato. Considera due regole:

1) Il carceriere sceglie casualmente tra B e C, e in questo caso è appena successo a dire C. Quindi la probabilità di A di essere graziato è 1/3.

2) Il carceriere dice sempre C. Quindi la probabilità che A venga graziato è 1/2.

Tutto ciò che ci viene detto è che il carceriere ha detto C, quindi non sappiamo quale di queste regole abbia seguito. In effetti, potrebbero esserci altre regole: forse il carceriere tira un dado e dice C solo se tira un 6.



0

Immagina che il carceriere dice ad A che C morirà sicuramente. E poi dice a B che C morirà sicuramente. È chiaro in questo caso che A e B hanno il 50% ciascuno da abbonare. Ma qual è la differenza tra le due versioni?


0

Il problema di tre prigionieri è diverso da quello di Monty Hall. La probabilità di essere perdonato è in realtà per Alice, non , ma solo se il carceriere segue la strategia "nomina sempre Bob quando possibile".1/22/3

Eventi: - Alice è graziata. Lo stesso vale per e . - jailer dice ad Alice il nome "Bob" (come risposta a "chi sarà giustiziato"). - dice il nome "Carl". Non può nominare Alice stessa a causa delle regole.ABCJJc

Siamo interessati a . Ora ci sono due scenari:P(A|J)=P(J|A)P(A)/P(J)

  1. Il carceriere lancia una moneta prima di dire B o C: .P(J|A)=12

P(A|J)=12×13/12=13
  1. Jailer dice il nome di Bob quando possibile: , anche e .P(J|A)=1P(J|C)=1P(J|B)=0

P(J)=P(J|B)P(B)+P(J|Bc)P(Bc)=0×13+1×23=23

P(A|J)=1×13/23=12

1
"Chiamare sempre Carl quando possibile" non sarebbe plausibile come "nominare sempre Bob quando possibile"?
Juho Kokkala,

Sì, la strategia S '= "sempre nominare Carl se possibile" deve essere completamente equivalente se ridefiniamo J di conseguenza. Se lasciamo J così com'è e costringiamo il carceriere a seguire S ', renderà tutto predeterminato: ogni volta che J (il carceriere dice Bob), sappiamo che non era possibile dire "Carl", quindi Carl fu graziato .
Mikhail Volkhov,

-1

Dopo aver ricevuto le informazioni, che il Prigioniero C morirà, le sue possibilità cambiano in 1/2, ma solo, perché le probabilità che lui ottenga tali informazioni sono già 2/3 (la possibilità 1/3 del prigioniero C di ottenere il perdono viene eliminata )

E 2/3 * 1/2 è la probabilità originale di essere liberato.

Più convincente è l'approccio oppositivo:

Supponiamo che gli venga detto che il prigioniero C otterrà la grazia.
Quali sono le sue possibilità di non essere ucciso?
Tutti riconosceranno che le sue possibilità sono zero, supponendo che il carceriere non mente e che vi sia un solo perdono.

Questa volta, ha la possibilità di 1/1, perché la possibilità di quell'informazione era già 1/3.


Questo non è corretto; vedi il calcolo nella risposta di Henry che mostra che dopo aver sentito le informazioni del carceriere, il prigioniero A ha una probabilità 2/3 di morire (non 1/2). Questa è la stessa probabilità che aveva prima, quindi il carceriere ha ragione: ciò che ha detto ad A non ha cambiato nulla per le probabilità di vita di A. Se B lo stesse ascoltando, ora avrebbe saputo che la sua possibilità di morire era ridotta a 1/3.
Ruben van Bergen,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.