Nell'apprendimento per rinforzo, l'approssimazione di funzioni lineari viene spesso utilizzata quando sono presenti ampi spazi di stato. (Quando le tabelle di ricerca diventano impossibili.)
La forma del valore con approssimazione della funzione lineare è data da
dove sono i pesi e sono le caratteristiche.f i
Le funzionalità sono predefinite dall'utente. La mia domanda è: come vengono assegnati i pesi?
Ho letto / scaricato alcune diapositive di lezione sull'apprendimento con approssimazione della funzione. La maggior parte di essi ha delle diapositive sulla regressione lineare che seguono. Dal momento che sono solo diapositive, tendono ad essere incomplete. Mi chiedo quale sia la connessione / relazione tra i due argomenti.