1. PROBABILITÀ NON NECESSARIE.
Le prossime due sezioni di questa nota analizzano i problemi "indovina quale è più grande" e "due inviluppi" usando gli strumenti standard della teoria delle decisioni (2). Questo approccio, sebbene semplice, sembra essere nuovo. In particolare, identifica una serie di procedure decisionali per il problema delle due buste che sono dimostrabilmente superiori alle procedure "cambia sempre" o "non cambia mai".
La sezione 2 introduce terminologia (standard), concetti e notazione. Analizza tutte le possibili procedure decisionali per "indovinare quale sia il problema più grande". Ai lettori che hanno familiarità con questo materiale potrebbe piacere saltare questa sezione. La sezione 3 applica un'analisi simile al problema delle due buste. La sezione 4, le conclusioni, sintetizza i punti chiave.
Tutte le analisi pubblicate di questi enigmi presuppongono che vi sia una distribuzione di probabilità che governa i possibili stati della natura. Questa ipotesi, tuttavia, non fa parte delle affermazioni del puzzle. L'idea chiave di queste analisi è che abbandonare questo presupposto (ingiustificato) porta a una semplice risoluzione dei paradossi apparenti in questi enigmi.
2. IL PROBLEMA "INDOVINA CHE È PIÙ GRANDE".
A uno sperimentatore viene detto che diversi numeri reali e x 2 sono scritti su due foglietti. Guarda il numero su una ricevuta scelta a caso. Basandosi solo su questa osservazione, deve decidere se è il più piccolo o più grande dei due numeri.x1x2
Problemi semplici ma aperti come questo sulla probabilità sono noti per essere confusi e controintuitivi. In particolare, ci sono almeno tre modi distinti in cui la probabilità entra nel quadro. Per chiarire questo, adottiamo un punto di vista formale sperimentale (2).
Inizia specificando una funzione di perdita . Il nostro obiettivo sarà quello di ridurre al minimo le sue aspettative, in un certo senso da definire di seguito. Una buona scelta è di rendere la perdita pari a quando lo sperimentatore indovina correttamente e 0 altrimenti. L'aspettativa di questa funzione di perdita è la probabilità di indovinare in modo errato. In generale, assegnando varie penalità a ipotesi errate, una funzione di perdita cattura l'obiettivo di indovinare correttamente. A dire il vero, l'adozione di una funzione di perdita è arbitraria come assumere una distribuzione di probabilità precedente su x 1 e x 210x1x2, ma è più naturale e fondamentale. Quando ci troviamo di fronte a prendere una decisione, consideriamo naturalmente le conseguenze di avere ragione o torto. Se non ci sono conseguenze in entrambi i casi, perché preoccuparsene? Intraprendiamo implicitamente considerazioni di potenziale perdita ogni volta che prendiamo una decisione (razionale) e quindi beneficiamo di una considerazione esplicita della perdita, mentre l'uso della probabilità per descrivere i possibili valori sui fogli di carta è superfluo, artificiale e ... vedremo —- può impedirci di ottenere soluzioni utili.
La teoria delle decisioni modella i risultati osservativi e la nostra analisi di essi. Utilizza tre oggetti matematici aggiuntivi: uno spazio campione, un insieme di "stati della natura" e una procedura decisionale.
Lo spazio campione costituito da tutte le possibili osservazioni; qui può essere identificato con R (l'insieme dei numeri reali). SR
Gli stati di natura sono le possibili distribuzioni di probabilità che regolano il risultato sperimentale. (Questo è il primo senso in cui possiamo parlare della "probabilità" di un evento.) Nel problema "indovina quale è più grande", queste sono le distribuzioni discrete che prendono valori a numeri reali distinti x 1 e x 2 con uguali probabilità di 1Ωx1x2 per ogni valore. Ω può essere parametrizzato da{ω=(x1,x2)∈R×R| x1>x2}.12Ω{ω=(x1,x2)∈R×R | x1>x2}.
Lo spazio decisionale è l'insieme binario delle possibili decisioni.Δ={smaller,larger}
In questi termini, la funzione di perdita è una funzione a valore reale definita su . Ci dice quanto sia “cattiva” una decisione (il secondo argomento) rispetto alla realtà (il primo argomento).Ω×Δ
La procedura di decisione più generale disponibile per lo sperimentatore è randomizzata : il suo valore per qualsiasi risultato sperimentale è una distribuzione di probabilità su Δ . Cioè, la decisione da prendere osservando il risultato x non è necessariamente definita, ma piuttosto deve essere scelta in modo casuale secondo una distribuzione δ ( x ) . (Questo è il secondo modo in cui può essere coinvolta la probabilità.)δΔxδ(x)
Quando ha solo due elementi, qualsiasi procedura randomizzata può essere identificata dalla probabilità che assegna a una decisione prespecificata, che per essere concreti consideriamo "più ampia". Δ
Uno spinner fisico implementa una tale procedura binaria randomizzata: il puntatore a rotazione libera arriverà a fermarsi nell'area superiore, corrispondente a una decisione in , con probabilità δ , e altrimenti si fermerà nell'area inferiore sinistra con probabilità 1 - δ ( x ) . Lo spinner è completamente determinato specificando il valore di δ ( x ) ∈ [ 0 , 1 ] .Δδ1−δ(x)δ(x)∈[0,1]
Pertanto una procedura decisionale può essere considerata come una funzione
δ′:S→[0,1],
dove
Prδ(x)(larger)=δ′(x) and Prδ(x)(smaller)=1−δ′(x).
Al contrario, tale funzione determina una procedura di decisione randomizzata. Le decisioni randomizzate includono decisioni deterministiche nel caso speciale in cui l'intervallo di δ ′ si trova in { 0 , 1 } .δ′δ′{0,1}
Diciamo che il costo di una procedura decisionale per un risultato x è la perdita attesa di δ ( x ) . L'attesa è rispetto alla distribuzione di probabilità δ ( x ) sullo spazio decisionale Δ . Ogni stato di natura ω (che, ricordiamo, è una distribuzione di probabilità binomiale sullo spazio campione S ) determina il costo atteso di qualsiasi procedura δ ; questo è il rischio di δ per ω , rischio δ ( ω )δxδ(x)δ(x)ΔωSδδωRiskδ(ω). Qui, l'aspettativa è presa rispetto allo stato della natura .ω
Le procedure decisionali vengono confrontate in termini di funzioni di rischio. Quando lo stato di natura è veramente sconosciuto, e δ sono due procedure e Rischio ε ( ω ) ≥ Rischio δ ( ω ) per tutti ω , allora non ha senso utilizzare la procedura ε , poiché la procedura δ non è mai peggiore ( e potrebbe essere migliore in alcuni casi). Tale procedura ε è inammissibileεδRiskε(ω)≥Riskδ(ω)ωεδε; in caso contrario, è ammissibile. Spesso esistono molte procedure ammissibili. Considereremo ciascuno di essi "buono" perché nessuno di essi può essere costantemente superato da qualche altra procedura.
Si noti che nessuna distribuzione precedente è stata introdotta su (una "strategia mista per C " nella terminologia di (1)). Questo è il terzo modo in cui la probabilità può far parte dell'impostazione del problema. Usarlo rende la presente analisi più generale di quella di (1) e dei suoi riferimenti, pur essendo più semplice.ΩC
La tabella 1 valuta il rischio quando il vero stato di natura è dato da Ricorda che x 1 > x 2 .ω=(x1,x2).x1>x2.
Tabella 1.
Decision:Outcomex1x2Probability1/21/2LargerProbabilityδ′(x1)δ′(x2)LargerLoss01SmallerProbability1−δ′(x1)1−δ′(x2)SmallerLoss10Cost1−δ′(x1)1−δ′(x2)
Risk(x1,x2): (1−δ′(x1)+δ′(x2))/2.
In questi termini il problema "indovina quale è più grande" diventa
Dato che non sai nulla di e x 2 , tranne che sono distinti, puoi trovare una procedura decisionale δ per la quale il rischio [ 1 - δ ′ ( maxx1x2δ è sicuramente inferiore a 1[1–δ′(max(x1,x2))+δ′(min(x1,x2))]/2 ?12
Questa affermazione equivale a richiedere ogni volta che x > y . Pertanto, è necessario e sufficiente che la procedura di decisione dello sperimentatore sia specificata da una funzione δ ′ strettamente crescente : S → [ 0 , 1 ] . Questo insieme di procedure include, ma è più ampio, tutte le "strategie miste Q " di 1 . Ce ne sono moltiδ′(x)>δ′(y)x>y.δ′:S→[0,1].Q di procedure decisionali randomizzate migliori di qualsiasi procedura non randomizzata!
3. IL PROBLEMA "DUE BUSTE".
È incoraggiante che questa semplice analisi abbia rivelato una vasta serie di soluzioni al problema "indovina quale è più grande", comprese quelle valide che non sono state identificate prima. Vediamo cosa può rivelare lo stesso approccio sull'altro problema che abbiamo di fronte, il problema della "doppia busta" (o "problema della scatola", come viene talvolta chiamato). Si tratta di una partita giocata selezionando casualmente una delle due buste, una delle quali ha il doppio di denaro rispetto all'altra. Dopo aver aperto la busta e aver osservato l'importo x di denaro al suo interno, il giocatore decide se conservare i soldi nella busta non aperta (per "cambiare") o conservare i soldi nella busta aperta. Si potrebbe pensare che cambiare e non cambiare sarebbero strategie ugualmente accettabili, perché il giocatore è altrettanto incerto su quale inviluppo contenga l'importo maggiore. Il paradosso è che la commutazione sembra essere l'opzione superiore, perché offre alternative "ugualmente probabili" tra i payoff di e x / 2 , il cui valore atteso di 5 x / 4 supera il valore nella busta aperta. Si noti che entrambe queste strategie sono deterministiche e costanti.2xx/2,5x/4
In questa situazione, possiamo formalmente scrivere
SΩΔ={x∈R | x>0},={Discrete distributions supported on {ω,2ω} | ω>0 and Pr(ω)=12},and={Switch,Do not switch}.
Come in precedenza, qualsiasi procedura di decisione può essere considerata una funzione da S a [ 0 , 1 ] , questa volta associandola alla probabilità di non cambiare, che può essere nuovamente scritta δ ′ ( x ) . La probabilità di commutazione deve ovviamente essere il valore complementare 1 - δ ′ ( x ) .δS[0,1],δ′(x)1–δ′(x).
La perdita, mostrata nella Tabella 2 , è il negativo del payoff del gioco. È una funzione del vero stato della natura , il risultato x (che può essere ω o 2 ω ) e la decisione, che dipende dal risultato.ωxω2ω
Tavolo 2.
Outcome(x)ω2ωLossSwitch−2ω−ωLossDo not switch−ω−2ωCost−ω[2(1−δ′(ω))+δ′(ω)]−ω[1−δ′(2ω)+2δ′(2ω)]
In addition to displaying the loss function, Table 2 also computes the cost of an arbitrary decision procedure δ. Because the game produces the two outcomes with equal probabilities of 12, the risk when ω is the true state of nature is
Riskδ(ω)=−ω[2(1−δ′(ω))+δ′(ω)]/2+−ω[1−δ′(2ω)+2δ′(2ω)]/2=(−ω/2)[3+δ′(2ω)−δ′(ω)].
δ′(x)=0δ′(x)=1), will have risk −3ω/2. Any strictly increasing function, or more generally, any function δ′ with range in [0,1] for which δ′(2x)>δ′(x) for all positive real x, determines a procedure δ having a risk function that is always strictly less than −3ω/2 and thus is superior to either constant procedure, regardless of the true state of nature ω! The constant procedures therefore are inadmissible because there exist procedures with risks that are sometimes lower, and never higher, regardless of the state of nature.
Comparing this to the preceding solution of the “guess which is larger” problem shows the close connection between the two. In both cases, an appropriately chosen randomized procedure is demonstrably superior to the “obvious” constant strategies.
These randomized strategies have some notable properties:
There are no bad situations for the randomized strategies: no matter how the amount of money in the envelope is chosen, in the long run these strategies will be no worse than a constant strategy.
No randomized strategy with limiting values of 0 and 1 dominates any of the others: if the expectation for δ when (ω,2ω) is in the envelopes exceeds the expectation for ε, then there exists some other possible state with (η,2η) in the envelopes and the expectation of ε exceeds that of δ .
The δ strategies include, as special cases, strategies equivalent to many of the Bayesian strategies. Any strategy that says “switch if x is less than some threshold T and stay otherwise” corresponds to δ(x)=1 when x≥T,δ(x)=0 otherwise.
What, then, is the fallacy in the argument that favors always switching? It lies in the implicit assumption that there is any probability distribution at all for the alternatives. Specifically, having observed x in the opened envelope, the intuitive argument for switching is based on the conditional probabilities Prob(Amount in unopened envelope | x was observed), which are probabilities defined on the set of underlying states of nature. But these are not computable from the data. The decision-theoretic framework does not require a probability distribution on Ω in order to solve the problem, nor does the problem specify one.
This result differs from the ones obtained by (1) and its references in a subtle but important way. The other solutions all assume (even though it is irrelevant) there is a prior probability distribution on Ω and then show, essentially, that it must be uniform over S. That, in turn, is impossible. However, the solutions to the two-envelope problem given here do not arise as the best decision procedures for some given prior distribution and thereby are overlooked by such an analysis. In the present treatment, it simply does not matter whether a prior probability distribution can exist or not. We might characterize this as a contrast between being uncertain what the envelopes contain (as described by a prior distribution) and being completely ignorant of their contents (so that no prior distribution is relevant).
4. CONCLUSIONS.
In the “guess which is larger” problem, a good procedure is to decide randomly that the observed value is the larger of the two, with a probability that increases as the observed value increases. There is no single best procedure. In the “two envelope” problem, a good procedure is again to decide randomly that the observed amount of money is worth keeping (that is, that it is the larger of the two), with a probability that increases as the observed value increases. Again there is no single best procedure. In both cases, if many players used such a procedure and independently played games for a given ω, then (regardless of the value of ω) on the whole they would win more than they lose, because their decision procedures favor selecting the larger amounts.
In both problems, making an additional assumption-—a prior distribution on the states of nature—-that is not part of the problem gives rise to an apparent paradox. By focusing on what is specified in each problem, this assumption is altogether avoided (tempting as it may be to make), allowing the paradoxes to disappear and straightforward solutions to emerge.
REFERENCES
(1) D. Samet, I. Samet, and D. Schmeidler, One Observation behind Two-Envelope Puzzles. American Mathematical Monthly 111 (April 2004) 347-351.
(2) J. Kiefer, Introduction to Statistical Inference. Springer-Verlag, New York, 1987.
sum(p(X) * (1/2X*f(X) + 2X(1-f(X)) ) = X
, dove f (X) è la probabilità che la prima busta sia più grande, dato qualsiasi X particolare.