2
Programmazione di una linea seguendo il robot con l'apprendimento del rinforzo
Sto pensando di programmare una linea seguendo il robot usando algoritmi di apprendimento di rinforzo. La domanda su cui sto riflettendo è come posso ottenere l'algoritmo per imparare a navigare attraverso qualsiasi percorso arbitrario? Dopo aver seguito il Sutton & Barto Book per l'apprendimento per rinforzo, ho risolto un problema …