Sono interessato a (Deep) Reinforcement Learning (RL) . Prima di immergermi in questo campo dovrei seguire un corso in Game Theory (GT) ?
Come sono correlati GT e RL ?
Sono interessato a (Deep) Reinforcement Learning (RL) . Prima di immergermi in questo campo dovrei seguire un corso in Game Theory (GT) ?
Come sono correlati GT e RL ?
Risposte:
In Reinforcement Learning (RL) è comune immaginare un sottostante processo decisionale Markov (MDP). Quindi l'obiettivo di RL è apprendere una buona politica per l'MDP, che è spesso solo parzialmente specificata. Gli MDP possono avere obiettivi diversi come la ricompensa totale, media o scontata, in cui la ricompensa scontata è il presupposto più comune per RL. Esistono estensioni ben studiate degli MDP alle impostazioni per due giocatori (ad es. Gioco); vedi, ad es.
Filar, Jerzy e Koos Vrieze. Processi decisionali di Markov competitivi . Springer Science & Business Media, 2012.
Esiste una teoria di base condivisa dagli MDP e dalle loro estensioni ai giochi a due giocatori (a somma zero), tra cui, ad esempio, il teorema del punto fisso di Banach, Iterazione di valore, Ottimizzazione di Bellman, Iterazione delle politiche / Miglioramento della strategia ecc. Tuttavia, mentre ci sono queste strette connessioni tra MDP (e quindi RL) e questi tipi specifici di giochi:
La teoria dei giochi è piuttosto coinvolta nel contesto dell'apprendimento di rinforzo multi-agente (MARL).
Dai un'occhiata ai giochi stocastici o leggi l'articolo An Analysis of Stochastic Game Theory for Multiagent Reinforcement Learning .
Non vedrei GT come un prerequisito per RL. Tuttavia, fornisce una piacevole estensione al caso multi-agente.
RL: un singolo agente viene addestrato per risolvere un problema decisionale di Markov (MDPS). GT: Due agenti sono addestrati per risolvere i Giochi. Un apprendimento di rinforzo multi-agente (MARL) può essere utilizzato per risolvere giochi stocastici.
Se sei interessato all'applicazione single-agent di RL in deep learning, non devi seguire alcun corso GT. Per due o più agenti potresti dover conoscere le tecniche teoriche del gioco.