Spiegare le strategie miste per i giochi one-shot


12

Nella classica introduzione alla teoria dei giochi non cooperativi, la strategia mista per un giocatore viene insegnata come una distribuzione sullo spazio della strategia per il giocatore. La distribuzione ci fornisce essenzialmente le probabilità (ad esempio, una serie di strategie discrete) con le quali un giocatore deve giocare le strategie in un equilibrio di Nash.

Comunque le probabilità portano la nozione di essere frequenze e queste essenzialmente significano la frazione di giochi a lungo termine in cui il giocatore dovrebbe giocare la strategia. Tuttavia, l'ambientazione è un gioco one-shot e questa è una contraddizione.

Come risolviamo la contraddizione quando spieghiamo cos'è una strategia mista?


2
Non è una contraddizione per chi prende il propensione interpretazione della probabilità, che vede il comportamento a lungo termine come la manifestazione di probabilità di un caso singolo.
Pburg

Risposte:


9

Ariel Rubinstein tende ad essere perspicace riguardo a questo tipo di domande.

Si occupa dell'interpretazione delle strategie miste nella sezione 3 di Questo carta.

Alcune possibili interpretazioni oltre alla randomizzazione intenzionale:

  1. Purificazione: una strategia mista è un piano d'azione basato su informazioni non specificate nel modello.
  2. Una storia a lungo termine fittizia.
  3. Medie della popolazione, quindi immagina che il giocatore venga estratto da una distribuzione di popolazione in cui diversi tipi giocano a strategie pure diverse. La distribuzione della popolazione è la distribuzione della strategia mista.

Una citazione interessante riguardante la strategia mista del giocatore $ i $ che riflette l'incertezza tra $ -i $ per quanto riguarda ciò che $ i $ farà:

La strategia mista può essere alternativamente considerata come la credenza posseduta da tutti gli altri   giocatori riguardo le azioni di un giocatore. Un equilibrio di strategia mista è quindi un   n-tupla di aspettative di conoscenza comune, che ha la proprietà che tutto il   le azioni a cui è assegnata una probabilità strettamente positiva sono ottimali, dato il   credenze. Il comportamento di un giocatore può essere percepito da tutti gli altri giocatori come   il risultato di un dispositivo casuale anche se questo non è il caso. Adottare questo   l'interpretazione richiede la rivalutazione di gran parte della teoria dei giochi applicata. Nel   in particolare, implica che un equilibrio non porti a una previsione (statistica   o altrimenti) del comportamento dei giocatori. Qualsiasi giocatore è l'azione che è il migliore   risposta data la sua aspettativa sul comportamento degli altri giocatori (l'altro   n - 1 strategie) è coerente come una previsione per l'azione di io (questo potrebbe includere   azioni che sono al di fuori del supporto della strategia mista). Questo rende   senza significato alcuna statistica comparativa o analisi del benessere della strategia mista   equilibrio e mette in discussione l'enorme letteratura economica che   utilizza l'equilibrio della strategia mista.


6

Sia $ s_i = \ {p_A ^ i, p_B ^ i \} $ denota una strategia che allega probabilità a giocare $ A, B $, e lascia $ s = \ {s_i, s_i \} _ i $ essere l'insieme di tali strategie ciò si traduce in un equilibrio in un gioco simmetrico a due giocatori.

Come dici tu, pensiamo a $ s_i $ per essere probabilità con cui viene giocata un'azione specifica. Ogni volta che $ s $ non è un singleton, abbiamo equilibri multipli, qualcosa che a molti rami dell'economia non piacciono, perché rende i modelli di risoluzione abbastanza difficili, e la non-unicità è difficile da lavorare: come dovremmo simulare il modello? Quale degli equilibri viene effettivamente suonato?

Almeno, con gli equilibri a strategia mista, conosciamo la probabilità che ciascuno degli equilibri si verifichi. Non ti piacciono le probabilità nella misura in cui portano frequenze, che tu dici sono contraddette dalla nozione che il gioco sia one-shot.

Contemporaneamente Tuttavia, il fatto che il gioco sia one-shot non significa che il gioco venga giocato una sola volta. In un mondo con molte persone, ognuno può trovare un partner e giocare una delle strategie in $ s $, nella misura in cui noi (allo stesso tempo!) Troviamo $ p_A $ di loro nell'equilibrio $ \ {A, A \} $ e la frazione $ p_B $ di individui che giocano il prossimo equilibrio, ecc.

Non Contemporaneamente In alternativa, potresti obiettare che in un mondo con un sacco di anonimato, le persone dimenticano i partner con cui hanno giocato prima. Abbiamo molte persone che giocano strategie in $ s $ alla volta $ t $, quindi li disaccoppiamo, offriamo a tutti i nuovi partner e li lasciamo giocare di nuovo. Anche se c'è la possibilità di incontrare lo stesso ragazzo di nuovo: poiché questa possibilità va a zero, potresti modellarlo come un gioco ripetuto con un fattore di sconto $ \ delta \ rightarrow 0 $.

Mancanza di impegno Infine, pensa a situazioni che sono in realtà giochi ripetuti, come le interazioni tra il governo e i consumatori. Mentre questo potrebbe essere modellato come un gioco ripetuto, potremmo pensare che il governo non è in grado di impegnarsi in una sequenza strategica. Pertanto, invece di modellarlo come un gioco ripetuto, lo modelliamo come ripetizioni dell'equilibrio one-shot: Dato un orizzonte temporale $ T $, vedremo che $ T \ cdot p_A $ delle volte, il governo e i consumatori gioca l'equilibrio $ \ {A, A \} $, ecc.


2

Questo è un supplemento della citazione di Pburg:

Una vista in Aumann e Brandenburger (1995) è che la strategia mista è solo agli occhi degli avversari. In un gioco $ N $ -player, l'insieme degli stati del mondo $ \ mathbf {S}: = \ times_ {i \ in N} S_i $. Per uno stato $ s \ in \ mathbf S $, soddisfa le seguenti specifiche:

  1. Per un giocatore $ i $, lascia $ \ pi_i: \ mathbf {S} \ a S_i $ essere la proiezione sul componente $ i $ th di uno stato. Quando viene realizzato uno stato, il giocatore $ i $ è assolutamente sicuro del proprio tipo $ s_i $, ma non è sicuro dello stato esatto. In altre parole, non sa quale stato in $ \ pi_i ^ {- 1} (s_i) $ viene ottenuto. Invece, ha creduto in $ \ pi_i ^ {- 1} (s_i) $, che è specificato da $ s_i $.
  2. Diamo $ A_i $ allo spazio azione del giocatore $ i $. La sua azione è una variabile casuale $ a_i: \ mathbf {S} \ in A_i $, mentre la sua restrizione $ \ left.a_i \ right | _ {\ pi_i ^ {- 1} (s_i)} $ è costante.
  3. La funzione di utilità $ i $ del giocatore $ g_i $ è definita allo stesso modo di $ a_i $, che significa $ g (s): \ mathbf {A} \ to \ mathbb {R} $ si riferisce alla stessa funzione di utilità , per tutti $ s \ in \ pi_i ^ {- 1} (s_i) $ per tutti $ s_i $.

1

Bene, ecco il mio colpo per rispondere, seguendo questo documento in Fisica http://bayes.wustl.edu/etj/articles/prob.in.qm.pdf . Penso che la propensione sia una buona interpretazione di strategie miste, ma in termini più formali dovremmo dire che cattura l'ignoranza del modellatore. Diciamo che tutto va, infatti tutte le strategie potrebbero essere prese (se il supporto è ovunque positivo) ma il concetto di soluzione dice che certe sono più probabili. Le probabilità qui misurano l'ignoranza del modellatore e sono il risultato della mancanza di informazioni del teorico di gioco sul gioco. Per chiarire questo concetto di un set di dati migliorato in cui conosciamo informazioni aggiuntive sul gioco, diciamo che parliamo con uno dei giocatori e ci assicura che sta per prendere una strategia, non importa quale, quindi possiamo fare una previsione più acuta nel forma di una pura strategia. Le frequenze sorgono quando pensiamo al gioco come a un tipico gioco, e vediamo diverse situazioni indipendenti in cui i giocatori con le stesse preferenze giocano questo gioco più volte, quindi le strategie miste corrisponderanno effettivamente nel limite (argomento asintotico) alla frequenza delle strategie osservate se il nostro modello è davvero corretto.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.