Libro di testo sull'apprendimento per rinforzo


12

Sto cercando un libro di testo / appunti per l'apprendimento per rinforzo. Sono appassionato di "Introduzione all'apprendimento statistico" , ma sfortunatamente non trattano questo argomento. So che un libro di Sutton e Barto è un riferimento standard, e forse anche l' NDP è buono, ma sono datati 1997-98, e speravo di trovare un'esposizione più moderna dal momento che questo campo probabilmente avrà un certo sviluppo negli ultimi tempo.

Risposte:


15

Penso che Sutton e Barto siano ancora lo standard. Ci sono molti mazzi di diapositive e note delle classi AI online, ma in genere non entrano in troppi dettagli.

Sutton and Barto è un po 'vecchio, ma stanno preparando una seconda edizione del loro libro di testo. Una bozza, datata gennaio 2018, è disponibile qui ; è collegato dalla pagina Web di Sutton , che contiene anche il testo completo della prima edizione.

TD(λ)

Oltre a ciò, potresti provare a immergerti in alcuni documenti: le cose di apprendimento del rinforzo tendono ad essere abbastanza accessibili.


Grazie, ho dato un'occhiata alla nuova edizione, ma non direi che è molto aggiornato. Sono ancora interessato a un'esposizione più aggiornata.
Ulisse il

Sì, sicuramente non è una revisione completa, ma nient'altro mi viene in mente oltre ad alcuni volumi di "Lecture Notes" di Springer, che sono essenzialmente solo raccolte di documenti. Se trovi qualcos'altro, pubblica un aggiornamento; Mi piacerebbe dargli un'occhiata.
Matt Krause,

Vedo, sicuramente lo farò
Ulisse il

1
@CharlieParker, non ne sono sicuro. La bozza più recente (19 giugno 2017) sembra abbastanza completa e menziona MIT Press, ma il sito MIT Press sembra vendere ancora la prima edizione. Per quello che vale, la bozza proviene direttamente dal sito Web pubblico degli autori, quindi non è necessario preoccuparsi di utilizzare una versione "trapelata" o qualcosa del genere.
Matt Krause,

1
@Thomas, ho aggiornato il collegamento con una bozza più recente.
Matt Krause,


6

Ecco alcuni buoni libri di testo / riferimenti:

Classico

Sutton RS, Barto AG. Apprendimento per rinforzo: un'introduzione. Cambridge, Massachussets: un libro di Bradford; 1998. 322 p.

La bozza per la seconda edizione è disponibile gratuitamente: https://webdocs.cs.ualberta.ca/~sutton/book/the-book.html

Russell / Norvig Capitolo 21:

Russell SJ, Norvig P, Davis E. Intelligenza artificiale: un approccio moderno. Upper Saddle River, NJ: Prentice Hall; 2010.

Più tecnico

Szepesvári C. Algorithms per l'apprendimento per rinforzo. Lezioni di sintesi su intelligenza artificiale e machine learning. 2010; 4 (1): 1-103. http://www.ualberta.ca/~szepesva/RLBook.html

Bertsekas DP. Programmazione dinamica e controllo ottimale. 4a edizione. Belmont, Mass .: Athena Scientific; 2007. 1270 p. Il capitolo 6, vol 2 è disponibile gratuitamente: http://web.mit.edu/dimitrib/www/dpchapter.pdf

Per sviluppi più recenti

Wiering M, van Otterlo M, editori. Insegnamento rafforzativo. Berlino, Heidelberg: Springer Berlin Heidelberg; 2012 Disponibile da: http://link.springer.com/10.1007/978-3-642-27645-3

Kochenderfer MJ, Amato C, Chowdhary G, How JP, Reynolds HJD, Thornton JR, et al. Il processo decisionale sotto incertezza: teoria e applicazione. 1 edizione. Cambridge, Massachusetts: The MIT Press; 2015. 352 p.

Apprendimento di rinforzo multi-agente

Buşoniu L, Babuška R, Schutter BD. Apprendimento di rinforzo multi-agente: una panoramica. In: Srinivasan D, Jain LC, editori. Innovazioni nei sistemi e nelle applicazioni multi-agente - 1. Springer Berlin Heidelberg; 2010 p. 183-221. Disponibile da: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

Schwartz HM. Apprendimento automatico multi-agente: un approccio di rinforzo. Hoboken, New Jersey: Wiley; Il 2014.

Video / Corsi

Suggerirei anche il corso David Silver su YouTube: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.