Voglio iniziare con uno scenario che mi ha fatto pensare a quanto bene MCTS può eseguire: supponiamo che ci sia una mossa che non è ancora stata aggiunta alla struttura di ricerca. È alcuni strati / si muove troppo in profondità. Ma se giochiamo a questa mossa, il gioco è sostanzialmente vinto. Comunque supponiamo anche che tutte le mosse che potrebbero essere prese invece nello stato di gioco dato siano molto cattive. Per ragioni di argomento, supponiamo che ci siano 1000 mosse possibili e solo una di esse è buona (ma molto buona) e il resto è molto male. MCTS non riuscirebbe a riconoscerlo e non a farlofar crescere l'albero di ricerca verso questa mossa e valutare molto male anche questa sottostruttura? So che MCTS alla fine converge in minimax (e alla fine costruirà l'intero albero se c'è abbastanza memoria). Quindi dovrebbe sapere che la mossa è buona anche se ci sono molte cattive possibilità. Ma suppongo che in pratica non si possa fare affidamento su questo. Forse qualcuno può dirmi se questa è una valutazione corretta da parte mia.
Oltre a questo scenario speciale, vorrei anche sapere se ci sono altri scenari in cui MCTS si esibirà male (o straordinariamente bene).