Osborne, equilibri di Nash e correttezza delle credenze


12

Nell'equilibrio di Osborne Un'introduzione alla teoria dei giochi, l' equilibrio di Nash è descritto come segue (pagg. 21–22):

Innanzitutto, ogni giocatore sceglie la sua azione in base al modello di scelta razionale, date le sue convinzioni sulle azioni degli altri giocatori. In secondo luogo, la convinzione di ogni giocatore sulle azioni degli altri giocatori è corretta.

Mi sembra che questa definizione non sia del tutto equivalente alla solita definizione dell'equilibrio di Nash come profilo strategico in cui la strategia di ciascun giocatore è la migliore risposta alle strategie degli altri.

La solita definizione non dice nulla sulle credenze e quindi consente la possibilità che le credenze possano essere errate.

Per prendere una banale possibilità, considera il dilemma del prigioniero. Supponiamo che ogni giocatore creda che l'altro giocatore non confesserà. Dato che confessare è una strategia dominante, ogni giocatore confesserebbe comunque. Quindi le azioni costituiscono un equilibrio di Nash anche se le credenze dei giocatori sono completamente l'opposto delle azioni di equilibrio reali.

Ho ragione nel comprendere che la definizione di Osborne caratterizza qualcosa di diverso dall'equilibrio di Nash?


Non "La solita definizione non dice nulla sulle credenze e quindi consente la possibilità che le credenze possano essere errate". Basti semplicemente sul fatto che hai sempre un presupposto di razionalità sottostante in queste definizioni?
Thorst,

Risposte:


9

Introdurre qui il linguaggio delle credenze è leggermente strano, dato che le credenze hanno un significato molto specifico in altre parti della teoria dei giochi.

In effetti, la descrizione di Osborne ricorda un equilibrio di Bayes Nash. Potremmo introdurre la nozione di credenze nella forma normale di un gioco informazione completa nel modo seguente: supponiamo che con probabilità ogni giocatore, , è un "strategico" tipo che suonerà in base alle (Nash) l'equilibrio, e con probabilità selezionerà una strategia uniformemente a caso (perché, diciamo, è indifferente in tutte le azioni). Abbiamo quindi un gioco bayesiano in cui pensare alle credenze è più naturale.aii1ai

Il concetto di soluzione Bayes Nash poi dice che 's strategia deve essere ottimale dato il gioco atteso indotta dagli altri giocatori' le strategie e le credenze sul loro tipi impliciti . Se consideriamo il limite come per tutti allora l'equilibrio di Bayes Nash di questo gioco coinciderà con il concetto di soluzione descritto da Osborne.i{aj}jiai1i


Immagino che il motivo per cui Osborne l'ha scritto in questo modo sia pedagogico, dato che si tratta di un testo introduttivo. Quando abbiamo introdurre gli studenti ai giochi statici, diciamo loro che il giocatore migliori risponde alle azioni degli altri giocatori. Gli studenti naturalmente vogliono sapere "come possono rispondere a una strategia scelta contemporaneamente senza sapere quale sarà quella strategia?" Questa è, in molti sensi, una domanda filosofica. Le risposte comuni sonoio

  • Se il gioco è uno che si gioca spesso allora (mettendo da parte i problemi di altri risultati che possono essere sostenuti in giochi ripetuti) possiamo pensare a Nash come a un equilibrio nel senso che se convergiamo lì possiamo sviluppare una norma in base alla quale le persone continuano giocare quell'equilibrio indefinitamente (e aspettarsi che gli altri facciano lo stesso).
  • Se il gioco è davvero un colpo solo, di solito invochiamo l'idea che i giocatori cercheranno di prevedere cosa faranno gli altri - e la nostra nozione di equilibrio incorpora l'idea che queste previsioni debbano essere corrette.

Sembra che le previsioni nel secondo punto corrispondano alle "credenze" invocate da Osborne. Tuttavia, è importante sottolineare che queste previsioni / "credenze", sono semplicemente uno strumento informale / intuitivo per aiutarci a concettualizzare ciò che sta accadendo in un equilibrio e non fanno parte della definizione di tale equilibrio. Il concetto di equilibrio di Nash stesso è completamente agnostico sulla nozione di credenze (come si nota in un commento, è definito solo sulle azioni), motivo per cui, quando Osborne continua a definire formalmente l' equilibrio di Nash, lo fa senza invocare il idea di credenze a tutti.


4

L'introduzione della convinzione rende il concetto di NE paragonabile ad altri concetti di raffinamento come PBE ed equilibrio sequenziale, ma il significato di NE non cambia.

Il micro-libro di testo laureato di Mas-Colell, Whinston e Green (MWG) ha un risultato per questo

Proposta 9.C.1. Un profilo strategico è un equilibrio di Nash di un gioco in forma estesa Γ E se e solo se esiste un sistema di credenze μ tale cheσΓEμ

  1. Il profilo strategico è sequenzialmente razionale dato il sistema di credenze μ in tutti gli insiemi di informazioni H tali che Pr ( H | σ ) > 0 .σμ HPr(H|σ)>0
  2. Il sistema di credenze deriva dal profilo strategico σ attraverso la regola di Bayes ogni volta che è possibile.μσ

Pertanto, l'esempio del Dilemma del Prigioniero che fornisci laddove i giocatori hanno convinzioni opposte a ciò che la strategia effettiva dell'avversario non riesce nella seconda condizione, che richiede che le credenze siano derivate dalla regola di Bayes ogni volta che è possibile. In realtà, questo è l'equivalente matematico del secondo requisito della definizione di Osborne: che la convinzione di un giocatore sulle azioni degli altri giocatori è corretta.


Penso che ci sia una differenza tra MWG e Osborne. MWG sta dicendo che per un equilibrio di Nash "esiste" un sistema di credenze che lo rende sensato. Rimaniamo in silenzio su ciò che le convinzioni, se del caso, hanno effettivamente i giocatori. Osborne sta dicendo che i giocatori hanno credenze e sono quelli giusti. Pensavo che quest'ultimo cambiasse il significato concettuale di NE poiché la solita definizione non menziona affatto credenze e l'esempio del Dilemma del Prigioniero mostra che le strategie non determinano in modo univoco le credenze.
Jyotirmoy Bhattacharya,

@JyotirmoyBhattacharya: non credo che MWG sia "in silenzio su ciò che le convinzioni, se del caso, i giocatori hanno effettivamente". La condizione 2 della proposizione richiede in realtà che questa convinzione sia derivata dal profilo della strategia di equilibrio usando la regola di Bayes quando possibile. Pertanto, nell'esempio PD, quando un giocatore sceglie il difetto con probabilità 1, la convinzione dell'altro giocatore deve anche mettere la probabilità 1 sul difetto dell'azione e rispondere al meglio data tale convinzione (che porta a scegliere anche il difetto).
Herr K.

@JyotirmoyBhattacharya: la convinzione per NE non deve essere unica, tuttavia. Questo perché se per un dato equilibrio, un percorso su un albero di gioco viene preso con probabilità zero, allora la regola di Bayes non si applica e quindi qualsiasi convinzione su quel percorso sarebbe considerata "corretta" in un NE. Questo è anche il motivo per cui vengono introdotti perfezionamenti come l'equilibrio sequenziale, in modo da escludere credenze irragionevoli dai percorsi di equilibrio.
Herr K.

@JyotirmoyBhattacharya: Inoltre, poiché è un libro di testo per studenti universitari, Osborne potrebbe aver scelto una lingua più intuitiva che matematicamente rigorosa per ragioni pedagogiche. Per me, le due condizioni nella definizione di Osborne sono esattamente controparti nella proposta di MWG.
Herr K.

3

L'esempio del dilemma del tuo prigioniero funziona solo perché è un gioco con strategie dominanti. Osborne è corretto.

Per rispondere al meglio alla strategia di un altro giocatore, come nella definizione che dai, devo conoscere la sua strategia. In altre parole, devo avere credenze su ciò che stanno facendo e quelle credenze devono essere corrette. Questo è un rafforzamento del concetto di razionalizzazione.

(σ,μ1)(σ,μ2)μ2σΣσioBio(σ-io)... "Credo che ciò significhi che definire le credenze non è necessario, perché le credenze sono esattamente una valutazione corretta del profilo della strategia. Il riferimento, uno dei miei libri, dà la solita definizione con una citazione di Nash (1950), e poi discute due ipotesi sottostanti: una è credenze corrette e l'altra è gioco razionale date quelle credenze corrette.


Ma per confutare qualcosa basta contare un esempio. Se prendi Osborne per affermare che la sua definizione è equivalente a quella di Nash, allora come si fa a contrastare il controesempio del dilemma del prigioniero. Capisco che la definizione di Osborne è un rafforzamento della razionalizzabilità, sostengo che non è l'equilibrio di Nash per la semplice ragione che qui l'equilibrio è definito su azioni e credenze mentre l'equilibrio di Nash è completamente silenzioso sulle credenze.
Jyotirmoy Bhattacharya,

1
È una definizione, non una prova.
Pburg,

Giusto. Ma è una definizione di un concetto che ha già un'altra definizione ben accettata. Quindi mi aspetto che se l'autore non menziona diversamente afferma che le due definizioni sono equivalenti.
Jyotirmoy Bhattacharya,

per essere chiari, include questi commenti nella definizione o nella discussione? ps Ho modificato la mia risposta
Pburg il

La parte che ho citato è la discussione. Subito dopo dice (p.22) "Questi due componenti sono incorporati nella seguente definizione" e quindi fornisce la definizione standard in termini di migliore risposta alle strategie che non menziona affatto le credenze. Allora, dove sono le credenze incarnate nella definizione? E il problema non è solo nei giochi con strategie dominanti. È del tutto possibile costruire esempi in cui non esistono strategie dominanti, ma le strategie di equilibrio di Nash sono le migliori risposte a credenze diverse dal gioco dell'equilibrio.
Jyotirmoy Bhattacharya,

2

Potrei ripetere cose che sono state dette in precedenza, ma ecco la mia opinione su questo.

Penso che affrontiamo un problema normale quando si confrontano due diversi modelli. Ciò che significa "equivalenza" non è del tutto evidente perché le due definizioni si trovano in mondi diversi o modelli diversi. Tuttavia, se "l'equivalenza" è correttamente definita, penso che si possa dare un senso alla definizione di Osborne e dimostrare che è effettivamente "equivalente" a un NE.

Il concetto di soluzione alla base della sezione citata sarebbe simile al seguente:

S*B*io

uio(Sio* | S-io=Bio*)uio(S' | S-io=Bio*) per tutti S'Sio
Bio*=S-io*

p

Questa è la parte difficile. Cosa significa che "Ogni NE è un BE"? Certamente non che "un NE più qualsiasi profilo di credenza sia un BE", come ha dimostrato l'OP con il suo contro-esempio. Tuttavia, è vero che "qualsiasi NE può essere trasformata in una BE per un certo profilo di credenza ". Penso che sia in questo senso che si dovrebbe capire l'affermazione di "equivalenza" di Osborne

Si noti che abbiamo anche la seguente dichiarazione più "simile all'equivalenza": "Un risultato del gioco è un risultato NE se e solo se è un risultato BE".


Ma ogni BE non è un NE poiché il concetto di BE è un indebolimento della razionalizzazione che noi siamo rigorosamente più deboli di NE.
Jyotirmoy Bhattacharya,

Come ho scritto, ho difficoltà a capire cosa significa per un BE "non essere" un NE perché sembrano vivere in modelli diversi. Vuoi dire che alcune strategie giocate in un BE non sono NE? Ho pensato che fosse errato, ma avrei potuto perdere qualcosa. Se è questo che intendi, potresti indicarmi un controesempio? Questo sarebbe molto utile.
Martin Van der Linden,

Non sono sicuro che BE sia un indebolimento della razionalizzazione. Nella mia comprensione, BE è razionalizzazione insieme alla condizione che le congetture siano corrette, giusto? Se ciò fosse corretto, allora NON saremmo più forti della razionalizzazione? (potrebbe ovviamente dipendere da quello che viene chiamato un concetto di soluzione "più debole / più forte")
Martin Van der Linden,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.