Qual è una buona risorsa per acquisire familiarità con l'apprendimento per rinforzo?


8

Conosco l'apprendimento supervisionato e non supervisionato. Ho seguito il corso SaaS tenuto da Andrew Ng su Coursera.org.

Sto cercando qualcosa di simile per l'apprendimento per rinforzo.

Puoi consigliarmi qualcosa?

Risposte:


5

Alle buone risposte qui, aggiungerei

Questi a malapena graffiano la superficie di RL, ma dovrebbero iniziare.


3

C'è una playlist di Youtube (nel canale DeepMind ) il cui titolo è Introduzione all'apprendimento per rinforzo , che è un corso (di 10 lezioni) sull'apprendimento per rinforzo di David Silver .

Una persona che ha seguito e completato il corso ha scritto (come commento su Youtube):

Corso eccellente Esempi abbastanza concreti, sufficienti per fornire una buona intuizione, e insegnati da qualcuno che è all'avanguardia nel campo dell'applicazione di RL ai giochi.


3

Prima di questo chiediti se vuoi davvero imparare "l'apprendimento per rinforzo". Sebbene ci sia molto clamore sull'apprendimento per rinforzo, l'applicabilità nel mondo reale dell'apprendimento per rinforzo è quasi inesistente. La maggior parte dei corsi online ti insegna molto poco sull'apprendimento automatico, quindi è molto meglio approfondire, piuttosto che procedere verso l'apprendimento di rinforzo. L'apprendimento di rinforzo dell'apprendimento è in qualche modo diverso dall'apprendimento di tecniche di apprendimento non supervisionate / supervisionate.

Detto questo, il modo più veloce per ottenere una buona conoscenza dell'apprendimento per rinforzo è il seguente:

  1. Leggi il post sul blog di Andrej Karpathy "Pong from Pixels".

  2. Guarda le lezioni di Deep RL Bootcamp .

  3. Per comprendere la matematica alla base di queste tecniche, fare riferimento a Sutton and Barto's Reinforcement Learning: An Introduction .

  4. Leggi i documenti pertinenti (gioco ecc.).

PS: assicurati di avere una conoscenza approfondita delle basi delle reti neurali, poiché la maggior parte degli articoli attuali in RL prevede l'uso di DNN in un modo o nell'altro come approssimatori.


real-world applicability of reinforcement learning is almost non-existent AlphaGo è stato addestrato con l'apprendimento per rinforzo.
cantordust,

Grazie, ciò che mi piace dell'apprendimento per rinforzo è che può migliorare se stesso semplicemente ripetendo il compito. Non è necessaria alcuna supervisione. Solo il modello deve descrivere correttamente il problema.
Martin S


@thecomplexitytheorist Sì, sono a conoscenza di quel post e sì, ci sono difficoltà associate a RL (come qualsiasi altro metodo ML). Tuttavia, queste difficoltà non implicano che la sua applicabilità sia nulla. Un altro esempio di successo (menzionato anche nel post) è il miglioramento dell'efficienza di raffreddamento dei data center di Google del 40% , quasi insignificante.
cantordust,

1
@cantordust, dovresti leggere completamente questo post, non c'è apprendimento "rinforzo dell'apprendimento" coinvolto nel "miglioramento dell'efficienza di raffreddamento", hanno chiaramente menzionato che hanno fatto previsioni basate sui dati del consumo di energia del passato.
riemann77,


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.