Fonti per la teoria dei giochi evolutiva algoritmica


15

Uso il termine del titolo in un senso molto ampio.

C'è una notevole quantità di lavoro sulla teoria dei giochi evolutiva, comprese le sue basi matematiche. Mi è stato consigliato "Giochi evolutivi e dinamiche della popolazione", ma non ho ancora approfondito.

C'è anche una notevole quantità di lavoro sulla teoria dei giochi algoritmica, che è un argomento popolare in questo sito.

Quello che mi piacerebbe vedere è un lavoro che rende complesse computazionali o dichiarazioni di convergenza su determinate dinamiche evolutive.

Esempi (formulati in modo molto approssimativo):

  1. Data una popolazione e uno schema evolutivo, possiamo dare un rimpianto probabilistico legato all'ottimalità della popolazione a lungo termine (rispetto al miglior individuo prodotto?). Ciò sembra essere fortemente correlato a gruppi di esperti e problemi di bandito. Che dire delle impostazioni non stazionarie?
  2. Dato un insieme di popolazioni di diverse specie che interagiscono nel loro ambiente, giocando praticamente a qualsiasi tipo di gioco multiplayer, quali affermazioni possiamo fare sull'eventuale stabilità delle loro strategie o distribuzioni di strategie, date le loro strategie evolutive.
  3. In qualsiasi tipo di ambiente con molte "nicchie" (un modo eccessivo di formularlo, capisco), sia in termini di relazione diretta con l'ambiente o in termini di relazioni con altre specie, quali affermazioni possiamo fare su come le popolazioni distribuiranno attraverso queste nicchie.
  4. Qualsiasi problema che non ho posto ma che dovrei - ci sto arrivando con poco AGT, TCS, algoritmi genetici, teoria dei giochi evolutiva o background di biologia della popolazione; Sto ponendo le mie domande da un punto di vista dell'ottimizzazione / apprendimento automatico / statistiche, che potrebbe essere sbagliato o incompleto.

Risposte:


11

Questo è uno degli argomenti in cui ho cercato connessioni da un po '. Tuttavia, non sembrano molto diffusi. Le persone che lavorano sulla biologia teorica e sull'economia che usano l'EGT, di solito si attengono alla teoria dei sistemi dinamici e non indossano l'obiettivo algoritmico. Pertanto, la maggior parte dei risultati sono dello stile AMath / Physics e non degli algoritmi e dello stile matematico discreto. Se sei disposto a perseguire l'approccio dei sistemi dinamici, allora c'è un sondaggio di Hofbauer e Sigmund che è più breve e più recente del loro libro (lo menziono e alcuni commenti di passaggio in una risposta precedente ).

Uno dei luoghi in cui la dinamica del replicatore è stata utilizzata nei risultati relativi alla complessità, è di Marcello Pelillo e coautori come euristico per risolvere la massima cricca (ridurre la massima cricca alla programmazione quadratica, risolvere la programmazione quadratica usando la dinamica del replicatore come euristica) :

[1] Immanuel M. Bomze e Marcello Pelillo [2000]. "Approssimazione della cricca di peso massimo mediante la dinamica del replicatore." Transazioni IEEE su reti neurali 11 (6)

[2] Marcello Pelillo e Andrea Torsello [2006]. "Payoff-Monotonic Game Dynamics e il massimo problema di cricca." Calcolo neurale 18: 1215-1258.

Puoi usare i loro risultati per mostrare che molte domande naturali associate alle strategie evolutive stabili sono NP-difficili (questo tipo di domanda 2). Infatti, Etessami e Lochbihler hanno dimostrato che è peggio di così e la questione dell'esistenza di ESS è sia NP che coNP-difficile, ma in . Di recente, Conitzer ha rafforzato questo aspetto per dimostrare che "esiste un ESS?" è un problema completo . Σ P 2Σ2PΣ2P

[3] Kousha Etessami e Andreas Lochbihler [2008] "La complessità computazionale delle strategie evolutivamente stabili". International Journal of Game Theory , 37 (1): 93-113. (Disponibile per la prima volta nel 2004 come rapporto tecnico ECCC TR04-055).

[4] Vincent Conitzer [2013] "L'esatta complessità computazionale delle strategie evolutivamente stabili". La nona conferenza su Web e Internet Economics (WINE) . ( pdf ).

Molte delle interessanti domande di EGT oggi riguardano i giochi sui grafici, e sebbene ci siano alcuni risultati dinamici del sistema, come (vedi anche questa domanda per le estensioni di questo approccio):

[5] Hisashi Ohtsuki e Martin Nowak [2006] "L'equazione del replicatore sui grafici". _ Journal of Theoretical Biology_, 243 (1), 86-97 ( link , post di blog )

Gran parte del lavoro passa attraverso la modellazione basata sugli agenti (vedere questa risposta per un contesto di modellizzazione della diffusione della malattia). Questi modelli sono in genere molto più favorevoli alle dichiarazioni di complessità e convergenza. Guarda il seguente libro per ulteriori informazioni:

[6] Yoav Shoham e Kevin Leyton-Brown [2009], "Sistemi multiagente: basi algoritmiche, teoriche dei giochi e logiche", stampa dell'Università di Cambridge.

Penso che l'apprendimento automatico sia un modo piuttosto semplice per avvicinarsi all'EGT, dal momento che è un naturale punto a metà strada tra la fisica pertinente (meccanica statistica) e l'informatica. Questo è stato sicuramente fatto, mi ci vorrebbe un po 'per trovare un buon riferimento, ma un riferimento casuale (che mostra anche che le persone EGT hanno preso in considerazione altri concetti di equilibrio popolari, come l'equilibrio correlato):

[7] Sergiu Hart e Andreu Mas-Colell [2000], "Una semplice procedura adattativa che porta all'equilibrio correlato", Econometrica 68 (5): 1127-1150

[8] Antonella Ianni [2001], "Imparare gli equilibri correlati nei giochi di popolazione", Mathematical Social Sciences 42 (3): 271-294.

[9] Ludek Cigler e Boi Faltings [2011], "Raggiungere gli equilibri correlati attraverso l'apprendimento multi-agente", AAMAS 2011: 509-516

Spero vivamente che altri diano risposte più specifiche, poiché questa è una domanda di cui ho sempre voluto sapere di più.


5

Come altri hanno già detto, c'è meno di quanto ti aspetteresti. Un paio di articoli tangenzialmente correlati:

"Pesi moltiplicativi nei giochi di coordinamento e la teoria dell'evoluzione" di Chastain, Livnat, Papadimitriou e Vazirani. Questo articolo sostiene che la dinamica evolutiva (in un modello semplice) equivale a un gioco di coordinamento tra geni che si gioca con l'algoritmo di apprendimento dei pesi moltiplicativo. Analizzano la variante dei 2 geni, in un modello semplificato.

Si noti che l'algoritmo dei pesi moltiplicativi è una dinamica naturale nota per convergere all'equilibrio di Nash in giochi a somma zero, giochi con potenziale non anatomico e altri (vedere ad esempio Freund e Schapire )

"The Price of Stochastic Anarchy" di Chung, Ligett, Pruhs e me stesso (di qualche tempo fa). Qui studiamo gli stati stocasticamente stabili di un gioco, che sono legati all'ESS. Non ci preoccupiamo della complessità di trovarli, ma dimostriamo che in alcuni giochi il prezzo dell'anarchia è più basso rispetto all'insieme degli equilibri stocasticamente stabili rispetto agli equilibri di Nash arbitrari.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.