Domande taggate «temporal-difference»

Quando sono preferiti i metodi Monte Carlo rispetto a quelli con differenza temporale?

Ultimamente ho fatto molte ricerche sull'apprendimento per rinforzo. Ho seguito l' apprendimento di rinforzo di Sutton & Barto : un'introduzione per la maggior parte di questo. So quali sono i processi decisionali di Markov e come l'apprendimento della programmazione dinamica (DP), Monte Carlo e differenza temporale (DP) può essere utilizzato …

12 monte-carlo reinforcement-learning temporal-difference

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.

Licensed under cc by-sa 3.0 with attribution required.