MODIFICARE
Il link @ unutbu nel commento è una buona lettura introduttiva.
Una solida conoscenza di AlphaZero richiede molto probabilmente un grado quantitativo (PhD?). Stai chiedendo un corso intensivo in AlphaZero?
Si prega di notare che a meno che non si investa una notevole quantità di tempo, nulla di quello che dico funzionerà. Non esiste un libro che possa eventualmente coprire tutto. Dovrai lavorare molto duramente.
Proviamo. Corso intensivo per AlphaZero.
1. Comprensione di base nell'apprendimento automatico
Numero infinito di libri. Ma se non hai tempo, consiglierei i corsi di apprendimento automatico del professor Andrew Ng su Coursera.
Le tue parole chiave: set di allenamento, set di test, discesa gradiente stocastica, tasso di apprendimento, GPU, funzione di costo, entropia incrociata .
2. Reti profondamente neutre
Devi conoscere le reti neurali. Consiglierei il libro di apprendimento approfondito del professor Ian Goodfellow se sei serio. Se non hai tempo, segui di nuovo il corso online del professor Andrew Ng su Coursera. Non devi andare attraverso tutti i capitoli (ma dovresti!).
YouTube ha molte introduzioni rapide alle reti neurali, provale.
Le tue parole chiave: neurone, strati, pesi, distorsione, mini-batch, attivazione .
3. Ricerca dell'albero di Monte Carlo
Dovresti capire cos'è Monte Carlo. I libri su Monte Carlo sono ovunque su Amazon. Leggi la Wikipedia su MCTS se non hai tempo.
Le tue parole chiave: campionamento, espansione, simulazione, implementazioni, backpropagation .
3. Apprendimento di rinforzo
Le tue parole chiave: gradiente politico, discesa gradiente, tasso di apprendimento
5. Rappresentazione della scacchiera
Il documento stesso è il più semplice. Il modello codifica lo stato della scheda (ad es. Pezzi) come una serie di valori binari di codifica a caldo singolo.
6. MCTS vs alpha-beta