Domande taggate «policy-gradients»

Qual è la relazione tra Q-learning e metodi di gradienti politici?

Per quanto ho capito, Q-learning e gradienti politici (PG) sono i due principali approcci utilizzati per risolvere i problemi di RL. Mentre il Q-learning mira a prevedere la ricompensa di una determinata azione intrapresa in un determinato stato, i gradienti politici predicono direttamente l'azione stessa. Tuttavia, entrambi gli approcci mi …

21 reinforcement-learning q-learning policy-gradients comparison

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.

Licensed under cc by-sa 3.0 with attribution required.