Algoritmi per il calcolo dell'equilibrio di Nash.


10

Ho cercato nel forum per vedere se questo è stato chiesto prima, e mentre si discute della teoria dei giochi algoritmica, non sono riuscito a trovare questo particolare problema risolto. Sto cercando di capire qual è l'algoritmo più noto per calcolare equilibri approssimativi (a strategia mista) di Nash in un gioco finito in n-persona. Naturalmente, questo algoritmo sarebbe PPAD. Sono più interessato alla velocità / efficienza che alla perfetta precisione dell'algoritmo.

Grazie Filippo


Possiamo aiutarti meglio se dai maggiori dettagli. Ad esempio quale valore di hai in mente? Hai in mente una struttura speciale della funzione di payoff? Hai davvero bisogno di un equilibrio di Nash o basterebbe un equilibrio correlato? Stai cercando qualcosa con buoni limiti dimostrabili o qualcosa con buone prestazioni pratiche? n
Warren Schudy,

Risposte:


7

La risposta breve è che, sebbene esistano alcuni algoritmi temporali polinomiali per trovare in modo dimostrabile equilibri approssimativi di Nash, trovano tutti approssimazioni relativamente scarse, probabilmente non abbastanza buone se si sta effettivamente cercando un algoritmo per giocare. Più è noto per i giochi a 2 giocatori che per i giochi a n giocatori.

Se quello che stai cercando di fare è effettivamente trovare un equilibrio (approssimativo) di Nash, una cosa facile da codificare che potresti provare è la simulazione del gioco, con ogni giocatore che usa l'algoritmo a maggioranza ponderata randomizzato (http://en.wikipedia.org/ wiki / Randomized_weighted_majority_algorithm). Questo non è garantito per funzionare, ma in molti casi lo farà (ed è garantito in alcune classi di giochi, come i giochi a somma zero). In particolare, se questo processo converge affatto, è garantito che converga in un equilibrio di Nash. Il pericolo è che non converga e non vada in bicicletta per sempre, ma anche in questo caso, la storia empirica del gioco converge all'insieme di equilibri correlati grossolani.


Ho iniziato a dare un'occhiata al documento menzionato nella risposta sopra. Non ho capito tutto (o gran parte a prima vista) ... puoi spiegare perché l'approssimazione è "relativamente scarsa?" Inoltre, potresti spiegare brevemente che cos'è un "equilibrio correlato approssimativo"? So cos'è un equilibrio correlato, ma cosa significa per un simile eq. essere grossolano. Infine, cosa intendi con "la storia empirica del gioco converge ... [ecc.]"? Come può qualcosa che non converge mai convergere in un insieme di CCE? Grazie per la tua risposta, sto cercando l'articolo di Wikipedia ora.
Philip White,

Per alcuni retroscena sugli algoritmi che producono distribuzioni che convergono in equilibri o equilibri correlati grossolani, inizierei qui: cs.cmu.edu/~avrim/Papers/regret-chapter.pdf
Aaron Roth

Se si desidera un equilibrio correlato piuttosto che un equilibrio grossolano correlato, è possibile utilizzare uno studente senza rimpianti interni. Ad esempio (spudorato plug) cs.brown.edu/~ws/papers/regret.pdf . Esistono anche algoritmi per il calcolo di equilibri correlati direttamente nel tempo polinomiale.
Warren Schudy,


4

Se sei interessato ad algoritmi che sono effettivamente implementati nel software, ce ne sono diversi che conosco:

  1. il pacchetto GAMBIT (http://www.gambit-project.org/doc/index.html) implementa diversi algoritmi di equilibrio di Nash per la forma normale a 2 giocatori e n-player, e in alcuni casi giochi di forma estesa.

  2. GameTracer (http://dags.stanford.edu/Games/gametracer.html) implementa gli algoritmi GNM e IPA di Govindan & Wilson per i giochi a forma normale n-player.

  3. Per i giochi di grandi dimensioni, la rappresentazione della forma normale è problematica in quanto le dimensioni aumentano esponenzialmente nel numero di giocatori. Invece, se la funzione di utilità del tuo gioco ha determinati tipi di struttura, puoi usare una "rappresentazione concisa" (ad esempio giochi grafici, giochi simmetrici, giochi con grafici ad azione) per esprimerla usando molto meno spazio; e inoltre la struttura può spesso essere sfruttata per accelerazioni computazionali. In termini di software, il solutore AGG (http://agg.cs.ubc.ca) adatta l'algoritmo GNM di GameTracer e l'algoritmo simpdiv di GAMBIT alla rappresentazione del gioco di azione-grafico (AGG). (Dichiarazione di non responsabilità: sono coinvolto nello sviluppo di questo pacakge software.)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.