La scommessa di Blackwell


12

Ho letto del paradosso delle scommesse di Blackwell sull'armadio Futility . Ecco il riassunto: ti vengono presentate due buste, ed . Le buste contengono una quantità casuale di denaro, ma non sai nulla sulla distribuzione del denaro. Ne apri uno, controlla quanti soldi ci sono ( ) e scegliere: prendi la busta o ?E y x E x E yExEyxExEy

Futility Closet si riferisce a un matematico chiamato Leonard Wapner: "Inaspettatamente, c'è qualcosa che puoi fare, a parte l'apertura dell'altra busta, per darti una possibilità persino migliore di farlo nel modo giusto."

L'idea, che mi sembra sbagliata, è la seguente: scegliere un numero casuale . Se , prendere . Se , selezionare .d < x E x d > x E ydd<xExd>xEy

Wapner: “Se d cade tra xey allora la tua previsione (come indicato da d) è garantita per essere corretta. Supponiamo che ciò si verifichi con probabilità p. Se d è inferiore a entrambi xey, la previsione sarà corretta solo nel caso in cui il numero scelto x sia il più grande dei due. C'è una probabilità del 50% di questo. Allo stesso modo, se d è maggiore di entrambi i numeri, la previsione sarà corretta solo se il numero scelto è il più piccolo dei due. Ciò si verifica anche con una probabilità del 50 percento. "

Se la probabilità che sia in è maggiore di zero, il successo medio di questo metodo è . Ciò significherebbe che osservando una variabile casuale non correlata ci fornisce ulteriori informazioni.[ x , y ] 1d[x,y]12+p2

Penso che sia tutto sbagliato e che il problema risieda nella scelta di un numero-casuale- casuale. Cosa significa? Qualche numero intero? In tal caso, la probabilità che è compreso fra ed è zero, poiché sia ed sono finite.d x y x ypdxyxy

Se diciamo che esiste un limite alla quantità massima di denaro, diciamo , o almeno scegliamo d da , allora la ricetta si riduce al banale consiglio di scegliere se e scegliendo se .1 ... M E y x < M / 2 E x x > M / 2M1...MEyx<M/2Exx>M/2

Mi manca qualcosa qui?

MODIFICARE

OK, ora comincio a vedere da dove viene l'apparente paradosso. Mi è sembrato impossibile che una variabile casuale non correlata possa fornire ulteriori informazioni.

Tuttavia, si noti che dobbiamo scegliere consapevolmente una distribuzione di d . Ad esempio, scegli i confini di una distribuzione uniforme, o della distribuzione di Poissionian ecc. Chiaramente, se stiamo giocando per le arachidi, e scegliamo che la distribuzione di d sia uniforme su dollari, . Quest'ultima probabilità dipenderà innanzitutto dal nostro giudizio su ciò che può essere nelle buste.[ 10 9 , 2 10 9 ]λ[109,2109]P(d(x,y))=0

In altre parole, se la tecnica funziona, allora viene violata l'assunzione che non sappiamo quale sia la distribuzione del denaro nelle buste (come è stata scelta la quantità di denaro per le buste). Tuttavia, se davvero non sappiamo cosa ci sia nelle buste, quindi nel peggiore dei casi, non perdiamo nulla applicandolo.

MODIFICA 2

Un altro pensiero. Dato , scegliamo, per il disegno , una distribuzione non negativa continua tale che . Ci è permesso farlo, ho ragione? Procediamo come indicato - se , manteniamo la busta, se , cambiamo la busta. Il ragionamento non cambia, a seconda di come scegliamo la distribuzione può essere che (o sbaglio?).d P ( d < x ) = P ( d > x ) d < x d > xxdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

Tuttavia, dato come abbiamo scelto la distribuzione, ciò che facciamo ora equivale a un lancio di una moneta. Lanciamo una moneta, e se è testa, cambiamo buste, se è croce, ci atteniamo alla busta che teniamo. Dove sbaglio?

MODIFICA 3 :

OK, ho capito adesso. Se basiamo la funzione di probabilità di su (ad esempio, campioniamo da una distribuzione uniforme nell'intervallo , allora la probabilità non è indipendente da .x d ( 1 , 2 x ) P ( d ( x , ydxd(1,2x)P ( decisione corretta | d ( x , y ) )P(d(x,y))P(correct decision|d(x,y))

Quindi, se (con probabilità ), l'ipotesi è sempre corretta, come prima. Se è il numero più basso, tuttavia, e , rispetto a ha una probabilità maggiore di essere inferiore a rispetto a maggiore di , quindi siamo orientati verso una decisione errata. Lo stesso ragionamento si applica quando è il più alto dei due numeri.p x d ( x , y ) d x x xd(x,y)pxd(x,y)dxxx

Ciò significa che dobbiamo scegliere il processo di disegno indipendentemente da . In altre parole, occorre fare un'ipotesi sui parametri di distribuzione da cui e sono disegnati; il peggio che succede è che indoviniamo ancora a caso, ma il migliore è che la nostra ipotesi era corretta - e quindi abbiamo un vantaggio. Come questo dovrebbe essere meglio che indovinare "x e y, penso, sarà almeno 1 $ , ma al massimo 10 $ , quindi se , lo manteniamo e, in caso contrario, lo scambiamo" Devo ancora vedere.x x y x > 5dxxyx>5

Sono stato fuorviato dalla formulazione pop-sci del problema nel libro di Wapner ( Unexpected Expectations: The Curiosities of a Mathematical Crystal Ball ), che afferma

"Seleziona comunque un intero positivo casuale" (Wapner suggerisce una distribuzione geometrica - lanciando monete fino a quando spuntano le prime teste, ripetendo il processo se ) "Se indovina più in alto e se indovina inferiore. (...) Indovina correttamente più del 50 percento delle volte perché indica correttamente più del 50 percento delle volte! "d > x d < x dd=xd>xd<xd


1
Molto strettamente correlati: stats.stackexchange.com/questions/95694
whuber

2
Questo è abbastanza diverso dal problema delle due buste, nel senso che: (1) l'argomento dato per cambiare il problema delle due buste è fallace, il difetto nell'argomento può essere visto aggiungendo un precedente bayesiano mentre (2) l'argomento dato da Wapner per la scommessa di Blackwell è corretto.
Matthew Gunn,

Se le somme di denaro nelle buste sono elementi arbitrari di un insieme di numeri S, una condizione sufficiente e necessaria per far funzionare la strategia di Wapner è che il CDF del numero che si sceglie di aumentare in modo rigoroso su S.
Reinstate Monica,

OK, mi manca ancora qualcosa - per favore vedi il mio EDIT 2, ma mi sembra che potremmo semplicemente lanciare una moneta e dovrebbe ancora funzionare, secondo il ragionamento. Dove sbaglio?
gennaio

Risposte:


8

Questo è più noto come il problema delle due buste . Più comunemente gli importi sono indicati come e ma non è necessario che ciò avvenga.2 AA2A

Alcuni punti:

  1. Non è possibile scegliere un numero intero casuale uniformemente *, ma la parte quotata non sembra richiedere che sia uniforme. Scegli una distribuzione - non importa quale sia l'argomento - purché abbia qualche probabilità di superare qualsiasi valore finito.

  2. Non avrebbe senso scegliere intero con la regola di decisione citata, perché il denaro è discreta che significa che c'è una possibilità diversa da zero e non c'è niente elencato per questo caso. (O in alternativa, per modificare la regola per specificare cosa fare quando sono uguali)d = xd d=x

  3. Lasciando da parte questo, potresti scegliere da una distribuzione continua non negativa - quindi non dobbiamo preoccuparci dell'uguaglianza.d

* (né puoi scegliere un numero intero non negativo uniformemente casuale né un numero intero uniformemente casuale positivo)


Se diciamo che esiste un limite alla quantità massima di denaro, diciamo , o almeno scegliamo da , allora la ricetta si riduce al banale consiglio di scegliere se e scegliendo sed 1 ... M E y x < M / 2Md1...MEyx<M/2 x > M / 2Exx>M/2

Se si scopre che la distribuzione casuale da cui viene scelta comprende dovrebbe funzionare (ti dà meglio di 50-50); se la distribuzione è bloccata a metà non lo farebbe.M / 2xM/2

Tuttavia, la versione di questo gioco che mi è stata presentata per la prima volta è che la busta è presentata da qualcuno che (probabilmente) cerca di minimizzare le tue entrate dal gioco. La strategia di utilizzare una distribuzione per decidere se passare all'altra busta funzionerà comunque in quell'istanza.


OK, punti (1-3) presi. Quindi, mi è permesso scegliere una distribuzione così casuale, non negativa, continua di che , giusto? Ma poi la decisione si basa essenzialmente sul lancio di una moneta ... sbaglio? P ( d < x ) = P ( ddP(d<x)=P(d>x)
gennaio

Non hai bisogno di . Hai solo bisogno di una probabilità diversa da zero per ottenere tra i due importi. P(d<x)=P(d>x)
Glen_b

Sì, ma mi è consentito definire la funzione di densità per come desidero, giusto? Lo faccio per condurre l'argomento a una conclusione assurda. d
gennaio

rendendo la tua strategia una funzione di x non ti stai dando il vantaggio di fare la scelta corretta quando d è tra xey: stai definendo la tua via d'uscita dalla vittoria del gioco. Se il link che fornisci afferma che una tale strategia funzionerà, sarebbe sbagliata
Glen_b -Reinstate Monica

Cosa, secondo il ragionamento di Wapner, mi proibisce di definire la funzione di probabilità usata per derivare come funzione di ? Fintanto che , il suo ragionamento dovrebbe ancora funzionare, sbaglio? Se utilizzo una distribuzione continua e non negativa che include (ad es. Distribuzione uniforme su , allora sono sicuro che sia così. E prenderò comunque la decisione corretta se .dxP(d(x,y))>0x(1,2x)d(x,y)
° gennaio

7

L'argomento di Wapner è corretto!

Alcuni commenti:

  • Seguendo la strategia di interruzione descritta in cui cambiamo inviluppi se è nella peggiore delle ipotesi inutile nelle aspettative ex ante. Con una buona scelta di , può essere abbastanza utile.x<dd
  • Se aggiungi un priore bayesiano (ovvero aggiungi credenze sulla distribuzione iniziale di denaro nelle buste), puoi risolvere il valore ottimale di date le tue precedenti convinzioni.d
  • In determinate situazioni (ad es. Dove più osservi, più è probabile che tu abbia la busta più grande), una strategia di interruzione è persino ottimale.
  • In un ambiente bayesiano più generale, puoi fare meglio di una semplice strategia di taglio per molti priori.

Un problema correlato ma diverso:

Come hanno già accennato diversi @Glen_b e @whuber, esiste un enigma correlato noto come Problema delle due buste in cui viene dato un argomento fallace per cambiare sempre le buste e il difetto nell'argomento può essere visto adottando un approccio bayesiano e aggiungendo precedenti credenze sul contenuto delle due buste.

In un certo senso, tuttavia, il puzzle descritto qui è piuttosto diverso. L'argomento di Wapner è corretto!


1
OK, ora vedo da dove viene il paradosso. O, per essere precisi, in cui le informazioni aggiuntive confluiscono nel sistema. Scegliendo consapevolmente la distribuzione di d , utilizziamo la nostra conoscenza a priori su dove, più o meno, dovrebbero essere le somme di denaro in entrambe le buste. Nel peggiore dei casi, la nostra conoscenza è inutile, ma il metodo garantisce che non saremo in svantaggio se lo utilizziamo.
gennaio

Dopo qualche pensiero, ancora non capisco - vedi EDIT 2.
Gennaio

Scenario (A) Immagina che la busta piccola abbia e che la busta grande abbia . Scegliamo = 15. . La regola decisionale ti porterebbe alla scelta corretta il 100% delle volte! 1020dP(x<d)=P(x>d)
Matthew Gunn,

Esaminiamo ora alcuni scenari (B). Immagina che la busta piccola abbia un numero dispari di dollari da 1 a 9 (es. 1 o 3 o 5 o 7 o 9) e la busta grande ne abbia 1 in più. Scegli e poi . Qui però, rispondi se la regola di decisione non è altrettanto utile! Porta alla decisione giusta se o e alla decisione sbagliata se . Ricorda che le coppie possibili sono (1,2), (3, 4), (5, 6), (7, 8) (9, 10) $ La cosa BAYESIANA OTTIMALE da fare sapendo che questa distribuzione iniziale è replicare se vedi un dispari quantità di denaro. P ( x < d ) = P ( x > d ) < 5,5 x = 1 , 3 , 5 , 6 , 8 , 10 x = 2 , 4 , 7 ,d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9
Matthew Gunn,

Non sappiamo la distribuzione di ed , quindi non possiamo prenderlo in un modo che ti proponi di esso. Una volta aperta la busta, conosciamo , ma non abbiamo idea che sia stata scelta casualmente tra numeri interi da 1 a 9, e quindi non possiamo scegliere come 5.5. Come menzionato da @Glen_b sopra, deve essere scelto da una distribuzione continua non negativa. y x d dxyxdd
gennaio

0

Ne sono rimasto incuriosito e ho adottato l'approccio pragmatico di giocarci in Excel.

Ho generato tre numeri casuali per x, y ed d nell'intervallo 1-100. Ho quindi fatto il confronto tra d e x e tra xey e ho guardato il risultato, giusto o sbagliato.

L'ho fatto 500 volte e l'ho ripetuto più volte, ottenendo regolarmente la risposta giusta circa 330 su 500, come previsto.

Ho quindi aumentato l'intervallo da d a 1-10000 e la risposta corretta è scesa a circa 260 per 500 corse.

Quindi sì, la selezione di d dipende dai valori previsti di xe y.

BoB


0

Penso che il paradosso apparente con l'espansione di Wapner dell'equazione p + (1-p) / 2 sia che assume che (1-p) / 2> 0. Per molti intervalli di d questo valore è 0.

Ad esempio: qualsiasi d selezionato da una distribuzione simmetrica centrata sul valore nell'inviluppo aperto, dà una probabilità di 1/2 errata e 1/2 corretta.

Qualsiasi distribuzione scelta asimmetricamente sembra distorcere la scelta nel modo sbagliato per metà del tempo.

Quindi c'è un modo per scegliere un intervallo e una distribuzione per d tale che questa equazione regge?

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.