1
Qual è la relazione tra Q-learning e metodi di gradienti politici?
Per quanto ho capito, Q-learning e gradienti politici (PG) sono i due principali approcci utilizzati per risolvere i problemi di RL. Mentre il Q-learning mira a prevedere la ricompensa di una determinata azione intrapresa in un determinato stato, i gradienti politici predicono direttamente l'azione stessa. Tuttavia, entrambi gli approcci mi …