Questo è un concetto molto importante quando il KOTH coinvolge un insieme relativamente semplice di decisioni, coinvolge solo pochi giocatori (in genere 2) ed è deterministico. Un equilibrio di Nash descrive una posizione "gridlock": se i due giocatori hanno deciso le loro due strategie, allora i due giocatori sono effettivamente bloccati in quelle posizioni: entrambi i giocatori che cambiano strategia semplicemente creano ulteriori vulnerabilità.
Esempi di giochi in cui gli equilibri di Nash sono importanti sono:
- Rock-Paper-Scissors (-Lizard-Spock), in cui una strategia "imbattibile" è un gioco casuale
- Morra , che ha uno "spettro" di equilibri. Peter Taylor ha scritto un buon esempio nella sua risposta qui .
- Prisoner's Dilemma, un gioco cooperativo noto per avere un ingorgo "tutti perdono"
Come trovare un equilibrio
Trovare un equilibrio in realtà è piuttosto semplice per la maggior parte dei giochi semplici ed è spesso piuttosto intuitivo. Un sacco di dettagli sui vari metodi sono disponibili su Internet. Il concetto di base, che è normalmente applicabile, è quello di creare un elenco di possibili strategie che i due giocatori possono usare (le opzioni fornite dal gioco). Se una strategia è "dominata" da un'altra, quella strategia può essere rimossa dall'elenco e il processo viene ripetuto. Per "dominio" intendo che se la strategia A dà sempre un risultato uguale o migliore della strategia B, rispetto a tutte le restanti strategie avversarie, la strategia B può essere rimossa dall'elenco.
Esempio: Rock-Paper-Scissors
RPS ha qualcosa chiamato un equilibrio "misto", nel senso che è coinvolta una distribuzione . Invece di giocare ripetutamente la stessa mossa (il che porterà a una rapida sconfitta), l'equilibrio è giocare 1/3 di rock, 1/3 di carta e 1/3 di forbici in una distribuzione casuale. Se gioco in modo casuale, non c'è niente che il mio avversario possa fare per ottenere un vantaggio su di me, punto. Se il mio avversario sceglie di non giocare in modo casuale, ciò crea solo una vulnerabilità da parte sua.
I giochi con equilibrio misto sono probabilmente i più comuni su PPCG, poiché possono assumere molte forme (l' unico gioco interessante che mi viene in mente con un puro equilibrio è il dilemma del prigioniero). Dovrei notare che l'equilibrio misto non deve essere uniformemente casuale , semplicemente qualcosa di diverso dal giocare ogni volta la stessa mossa.
Utilizzando queste informazioni
L'equilibrio di Nash di un gioco spesso rappresenta la "linea di base" da cui dovresti cercare di operare. In RPS, giocare in modo casuale garantisce un punto di arrivo intorno al centro del gruppo. Per passare all'inizio, devi iniziare a identificare i punti deboli degli altri giocatori.
Per fare questo, dovresti attenersi all'equilibrio quando non sei sicuro delle debolezze dell'avversario. Una volta identificati quei punti deboli (hai scoperto che il tuo avversario non è in equilibrio), allora devi spostarti delicatamente fuori equilibrio per trarre vantaggio dal tuo avversario. Questa azione, a sua volta, crea punti deboli da parte tua. Devi quindi rilevare quando il tuo avversario sta cambiando la sua strategia, in modo da poter quindi fermare l'attacco e riprendere il gioco casuale.
Rilevamento delle variazioni dall'equilibrio
Questo è piuttosto difficile e non sono un esperto. Le variazioni possono presentarsi in molte forme:
- Favorire alcune opzioni sopra / sotto le altre senza motivo, come un giocatore RPS che suona il rock due volte più spesso delle forbici o uno che evita di giocare con la carta. Alcune statistiche relativamente semplici possono rilevarlo.
- Basare una mossa corrente su mosse passate, secondo uno schema prevedibile. Ciò include i "copy-cat", i robot "batte ciò che batte la tua ultima mossa" o i robot "ciclabili". Ciò richiede una logica aggiuntiva per il rilevamento, poiché la distribuzione globale delle mosse può essere distribuita uniformemente, anche se le mosse non sono casuali. Dovresti tentare di prendere nota delle mosse e trovare correlazioni come "la mossa che ho fatto 2 turni fa e la mossa che il mio avversario ha fatto ora" e "la mossa che ha fatto 1 turno fa e la mossa che ha fatto ora", ecc.
- Bot la cui distribuzione delle mosse è basata sulla tua. La vulnerabilità in questi bot spesso non viene creata (in quantità misurabile) fino a quando non si è passati da una distribuzione casuale a un'altra. In generale, il tuo bot rientra in questa categoria.