Mi chiedo come addestrare una rete neurale per un gioco da tavolo a base circolare come tic-tac-toe, scacchi, rischi o qualsiasi altro gioco a base circolare. Ottenere la mossa successiva per inferenza sembra essere piuttosto semplice, alimentando lo stato del gioco come input e usando l'output come mossa per il giocatore corrente. Tuttavia, allenare un'intelligenza artificiale a tale scopo non sembra essere così semplice, perché:
- Potrebbe non esserci una valutazione se una singola mossa è buona o meno, quindi l'allenamento delle singole mosse non sembra essere la scelta giusta
- Usare tutti gli stati di gioco (input) e le mosse (output) dell'intero gioco per allenare la rete neurale, non sembra essere la scelta giusta in quanto non tutte le mosse all'interno di una partita persa potrebbero essere sbagliate
Quindi mi chiedo come addestrare una rete neurale per un gioco da tavolo a base circolare? Vorrei creare una rete neurale per tic-tac-toe usando tensorflow.