Paradosso della busta


8

Ci sono due buste. Uno contiene denaro e l'altro contiene quantità di denaro. La quantità esatta " " non mi è nota, ma conosco quanto sopra. Prendo una busta e la apro. Vedo soldi in esso, ovviamente dove .x2xxyy{x,2x}

Ora mi viene offerto di conservare o cambiare buste.

Il valore atteso di commutazione è . Il valore atteso di mantenere la mia busta è .(122y+1212y)=54yy

Sembra che dovrei sempre cambiare buste. Le mie due domande:

Questo ragionamento è corretto?

C'è da diverso se non mi è permesso di aprire la busta e vedere la quantità di denaro, e poi mi viene data la possibilità di passare a tempo indeterminato?y



1
Non puoi semplicemente accettare le aspettative, dovresti iniziare con le credenze su x e aggiornare le tue credenze secondo la regola di Bayes. Una volta che vedi y, le tue convinzioni su quale busta hai aperto saranno cambiate.
HRSE

Supponiamo che x sia distribuito uniformemente tra 0 e . E allora?
Cavalleria Kitsune

@KitsuneCavalry Non esiste tale disprezzo. (Vi prego di inviarmi un programma che genera tale distribuzione.) In realtà non esiste una soluzione che generi le credenze più importanti fornite nella vostra domanda per tutti i valori di . Nel link di Herr K. questo è spiegato in en.wikipedia.org/wiki/…y
Giskard

3
Cavalleria @Kitsune La distribuzione uniforme sulla mezza linea (o sull'intera linea) è un precedente improprio ben noto nelle statistiche bayesiane, vedere per un assaggio stats.stackexchange.com/a/97790/28746 o stats.stackexchange.com/a/ 35794/28746
Papadopoulos,

Risposte:


5

Ecco un approccio "massimizzazione dell'utilità attesa / teoria dei giochi" alla materia (con un pizzico di probabilità teorica impostata). In tale contesto, le risposte sembrano chiare.

LOCALI

Ci viene detto in assoluta onestà che, per un importo monetario strettamente positivo, i seguenti due ticket sono stati collocati in una scatola: con il numero di identificazione assegnato e con il numero identificativo assegnatox{A=x,B=2x}1{A=2x,B=x}0. Quindi un pareggio da un Bernoulli (p=0.5) la variabile casuale è stata eseguita e in base al risultato e all'evento che si è verificato, gli importi x e 2x sono stati messi in buste A e B. Non ci viene detto quale sia il valore dix è o quale importo è andato a quale busta.

Primo CASO: scegli una busta con l'opzione per passare senza aprirla

Il primo problema è come scegliere una busta ? Questo ha a che fare con le preferenze. Supponiamo quindi che ci aspettiamo massimizzatori di utilità, con funzione di utilitàu().

Possiamo modellare la struttura probabilistica qui considerando due variabili dicotomiche casuali, A e Bche rappresentano le buste e la quantità in esse contenuta. Il supporto di ciascuno è{x,2x}. Ma non sono indipendenti. Quindi dobbiamo iniziare con la distribuzione congiunta. Sotto forma di tabella, la distribuzione congiunta e le corrispondenti distribuzioni marginali sono

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

Questo ci dice questo A e B hanno identiche distribuzioni marginali.

Ciò significa che non importa come scegliamo le buste, perché avremo sempre la stessa utilità prevista ,

0.5u(x)+0.5u(2x)

Ciò che stiamo affrontando qui è una scommessa composta (come scegliere una busta) su due scommesse identiche (ogni busta). Possiamo scegliereA con probabilità 1, 0o qualsiasi altra via di mezzo (e complementare per B). Non importa Avremo sempre la stessa utilità prevista. Si noti che il nostro atteggiamento nei confronti del rischio non ha un ruolo qui.

Quindi scegliamo una busta, diciamo Ae lo stiamo guardando. Qual è ora la nostra utility prevista? Esattamente come prima di scegliere . Scegliere una busta in qualsiasi modo, non influisce sulle probabilità di ciò che è dentro.

Siamo autorizzati a cambiare. Di 'che lo facciamo, e ora stiamo tenendo la bustaB. Cosa sono ora le utility previste? Esattamente come prima .

Questi sono i due possibili stati del mondo per noi: scegliere A o scegli B. In qualsiasi scelta, entrambi gli stati del mondo implicano lo stesso valore per la nostra forza trainante presunta / presunta (ovvero massimizzare l'utilità attesa).

Quindi qui, siamo indifferenti al passaggio. e in effetti potremmo anche randomizzare.

2 ° CASO: APRIRE LA BUSTA con l'opzione per cambiare dopo

Supponiamo ora di aver scelto A, l'aprì e trovò all'interno dell'importo y{x,2x}. Questo cambia le cose?

Vediamo. Mi chiedo cosa sia

P(A=xA{x,2x})=?

Bene, {x,2x} è lo spazio di campionamento su cui variabile casuale Aè definito. Il condizionamento su tutto lo spazio del campione, cioè sulla banale sigma-algebra, non influenza né le probabilità né i valori previsti. È come se ci chiedessimo "qual è il valore diA se sappiamo che tutti i possibili valori potrebbero essere stati realizzati? "Nessuna conoscenza effettiva è stata acquisita, quindi siamo ancora alla struttura probabilistica originale.

Ma mi chiedo anche cosa sia

P(B=xA{x,2x})=?

La dichiarazione di condizionamento, correttamente vista come sigma-algebra generata dall'evento {A{x,2x}}, è l'intero spazio di campionamento del prodotto su cui si trova il vettore casuale (A,B)è stata definita. Dalla tabella della distribuzione congiunta sopra, possiamo vedere che l'allocazione di probabilità dell'articolazione è equivalente per quanto riguarda l'allocazione di probabilità dei marginali (la qualificazione "quasi sicuramente" dovuta alla presenza di due eventi di misura zero). Quindi anche qui essenzialmente condizioniamo le probabilità perBsu tutto il suo spazio campione. Ne consegue che la nostra azione di apertura dell'involucro non ha influito sulla struttura probabilisticaB anche.

Entra nella teoria dei giochi, insieme al processo decisionale. Abbiamo aperto la busta e dobbiamo decidere se passare o meno. Se non cambiamo otteniamo utilitàu(y). Se cambiamo, allora siamo nei seguenti due possibili stati del mondo

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

Non sappiamo quale stato detenga effettivamente, ma per la discussione sopra, sappiamo che ognuno ha probabilità p=0.5 di esistente.

Possiamo modellarlo come un gioco in cui il nostro avversario è "natura" e dove sappiamo che la natura gioca con certezza una strategia randomizzata : conp=0.5 y=x e con p=0.5, y=2x. Ma ora anche che se non cambiamo, il nostro guadagno è certo. Quindi, ecco il nostro gioco in forma normale, con i nostri profitti:

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

Dovremmo resistere alla tentazione di sostituire u(x) e u(2x) per u(y). u(y)è un payoff noto e certo. I profitti per la strategia "Switch" non sono effettivamente noti (poiché non conosciamo il valore dix). Quindi dovremmo invertire la sostituzione . Sey=x poi u(2x)=u(2y), e se y=2x poi u(x)=u(y/2). Quindi, ecco di nuovo il nostro gioco:

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

Ora tutti i payoff nella matrice sono noti. Esiste una strategia dominante pura?

Il payoff atteso della strategia "Switch" è

E(VS)=0.5u(2y)+0.5u(y/2)

Il payoff atteso della strategia "Don't Switch" è

E(VDS)=u(y)

Dovremmo cambiare se

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

E ora l' atteggiamento nei confronti del rischio diventa critico. Non è difficile dedurre che in caso di assunzione di rischi e comportamenti neutrali, dovremmo passare.

Per quanto riguarda il comportamento avverso al rischio , trovo un risultato elegante:

Per funzioni di utilità "meno concave" (rigorosamente sopra) rispetto a quelle logaritmiche (diciamo, radice quadrata), dovremmo comunque passare a Switch.

Per utilità logaritmica u(y)=lny, siamo indifferenti tra il passaggio o meno.

Per "più concava" di (rigorosamente sotto) funzioni di utilità logaritmiche, dovremmo non commuta.

Concludo con il diagramma del caso logaritmico

inserisci qui la descrizione dell'immagine

Assumere y=4. Poiy/2=2,2y=8. La lineaΓΔΕè la linea su cui giace l'utilità prevista da "Switch". Dal momento che la natura gioca a5050 strategia, sarà effettivamente al punto Δ, che è il punto centrale di ΓΔΕ. A quel punto con l'utilità logaritmica, otteniamo esattamente la stessa utilità da "Don't Switch", ovveroln(4) per questo esempio numerico.


Invocare "avversione al rischio" attraverso una funzione di utilità logaritmica non risolve il paradosso. Come notato da @HRSE, usando il teorema di Bayes, le probabilità sono i profittiu(2y) e u(y/2non sono 0,5 dopo aver visto l'importo nella prima busta. Ciò sarebbe valido solo per un'uniforme altamente discutibilex (per x>0). Se si utilizza un precedente adeguatox (riflettendo le proprie convinzioni circa x), la soluzione diventa se y è sufficientemente piccolo e per mantenere la prima busta se yè sufficientemente grande. Vedi jstor.org/stable/2685310 .
Jarle Tufto,

@JarleTufto Per come la vedo io, il precedente uniforme è il precedente corretto, se si decide di credere agli organizzatori del gioco, quando dicono che gli importi in denaro sono stati messi nelle buste a seguito di un pareggio di Bernoulli con p=0.5. Se uno vuole essere sospettoso, non credere agli organizzatori e formare qualche altra precedente convinzione, è ovviamente un suo diritto, ma dovrebbe venire con qualche argomento per convincermi su a) perché gli organizzatori mentono eb) come sceglie il diverso prima che sceglie? Nota che la mia risposta presuppone che crediamo gli organizzatori in materia.
Alecos Papadopoulos,

Sono ovviamente d'accordo che ti vengano fornite buste contenenti importi X e 2Xrispettivamente con pari probabilità di 1/2. Quello che sto dicendo è che l'uniforme impropria implicita primaX che usi, cioè π(x)=1, per tutti x>0 porta al paradosso perché il teorema di Bayes porta poi a P(X=y|Y=y)=P(X=y/2|Y=y)=1/2 dove yè la quantità osservata nella prima busta. Usando un precedente adeguatoπ(x) invece, queste probabilità condizionate differiscono e dipende la decisione ottimale y(e ovviamente la funzione di utilità).
Jarle Tufto,

@JarleTufto Questo improprio prima di menzionare, riflette le probabilità relative a cosa?
Alecos Papadopoulos,

La quantità di denaro nelle due buste è X e 2X. La precedente distribuzione di probabilità rappresenta le tue convinzioni circaXprima di aprire qualsiasi busta. O stai implicitamente usando questo particolare precedente o stai commettendo l'errore di equiparare le probabilità condizionate inverse.
Jarle Tufto,

0

Se si apre la busta E1 e si vede che il suo valore è E1 = Y , è vero che il valore dell'altra busta E2 è in {E2 = Y / 2, E2 = 2Y} .

È anche vero che il valore atteso di tale inviluppo è (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

L'errore è supponendo che Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 indipendentemente da quello Y è. Un modo semplicistico per dimostrarlo è quello di supporre che ogni busta contenga banconote statunitensi di varie denominazioni. Se Y = $ 1 , allora è impossibile che E2 sia Y / 2 .

Una prova più rigorosa è troppo dettagliata per fornire qui, ma un sommario di essa deve prima supporre che, per qualsiasi valore Z , Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Questo è essenzialmente lo stesso presupposto dell'ultimo paragrafo, esteso a un intervallo di valori. Ma se questo è vero per qualsiasi valore di Z , significa che Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) è costante per ogni valore di N , da -inf a inf. Poiché ciò è impossibile, l'assunto non può essere corretto.

+++++

Potrebbe essere stato un po 'confuso, quindi lasciami provare un esempio. Ti vengono dati due set di due buste. In un set, contengono 10 e 20 dollari. Nell'altra, contengono 20 e 40. Scegli un set, quindi apri una busta in quel set per trovare 20. Ti viene quindi offerta la possibilità di passare all'altra busta in quel set. Dovresti?

Sì, dovrebbe cambiare. Il guadagno atteso passando all'altro inviluppo è [(20-10) + (20-40)] / 2 = +5.

Nota che questa istanza , ovvero sapere che hai trovato 20 e non 10 o 40, si adatta alle condizioni che descrivi nella tua domanda. Quindi la tua soluzione funziona. Ma l'esperimento stesso non corrisponde a quella descrizione. Se ne hai trovati 10 o se ne hai trovati 40, la probabilità che l'altra busta abbia 20 è del 100%. I guadagni previsti sono rispettivamente +10 e -20. E se fai una media dei tre possibili guadagni rispetto alle probabilità otterrai i tre valori, otterrai 10/4 + 5/2 - 20/4 = 0.


Perché dovrei supporre che una busta non possa contenere 50 centesimi? Inoltre, la domanda è in particolare quella di chiedere a volte in cui non si conoscono i possibili importi che potrebbero esserci, solo i possibili importi relativi, quindi non lo sto seguendo.
Cavalleria Kitsune

Ho detto che era un approccio semplicistico. È iniziato con "supponiamo che ogni busta contenga carta americana". Dal momento che non puoi avere 50 centesimi nella moneta cartacea degli Stati Uniti, Pr (E2 =2|E1=1) = 1. Il punto è che supponendo che Y / 2 e 2Y siano ugualmente probabili, quando non si conosce Y, si assume una distribuzione di fatto per Y che è impossibile da raggiungere.
JeffJo

0

Generalmente il problema è irrisolvibile perché non è stata specificata la procedura di randomizzazione dell'intero esperimento.

Ma lascia che Y sia il valore della busta che hai scelto e X l'altra busta. La risposta è quindiE[X|Y=y]- che è un'aspettativa condizionale . Tuttavia, supponendo che una distribuzione più generale di Y, Y sia uniformemente disegnata da tuttiR. Ma alloraPr(Y=y)=0e dal paradosso di Borel – Kolmogorov l'attesa è irrisolvibile.


@JeffJo, non ho potuto commentare sotto il tuo post a causa della scarsa reputazione. Ho aggiunto questa risposta perché credo sia correlata al tuo post.
John Rambo,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.