L'apprendimento supervisionato è un sottoinsieme dell'apprendimento per rinforzo?

Sembra che la definizione di apprendimento supervisionato sia un sottoinsieme dell'apprendimento di rinforzo, con un particolare tipo di funzione di ricompensa che si basa su dati etichettati (al contrario di altre informazioni nell'ambiente). È una rappresentazione accurata?

— tutte le stelle
fonte

È vero che qualsiasi problema di apprendimento supervisionato può essere definito come un problema di apprendimento di rinforzo equivalente: lasciare che gli stati corrispondano ai dati di input. Lascia che le azioni corrispondano alle previsioni dell'output. Definire la ricompensa come il negativo della funzione di perdita utilizzata per l'apprendimento supervisionato. Massimizza la ricompensa prevista. Al contrario, i problemi di apprendimento di rinforzo non possono generalmente essere definiti come problemi di apprendimento supervisionato. Quindi, da questo punto di vista, i problemi di apprendimento supervisionato sono un sottoinsieme di problemi di apprendimento di rinforzo.

Ma cercare di risolvere un problema di apprendimento supervisionato usando un algoritmo di apprendimento di rinforzo generale sarebbe piuttosto inutile; tutto ciò che fa è gettare via la struttura che avrebbe reso il problema più facile da risolvere. Nell'apprendimento per rinforzo sorgono vari problemi che non sono rilevanti per l'apprendimento supervisionato. E, l'apprendimento supervisionato può beneficiare di approcci che non si applicano nel contesto generale dell'apprendimento per rinforzo. Quindi, sebbene ci siano alcuni principi e tecniche condivise comuni tra i campi, in genere non si vede l'apprendimento supervisionato discusso come un tipo di apprendimento di rinforzo.

Riferimenti

Barto e Dietterich (2004) . Apprendimento di rinforzo e sua relazione con l'apprendimento supervisionato.

— user20160
fonte