Domande taggate «policy»

3
La politica ottimale è sempre stocastica se anche l'ambiente è stocastico?
La politica ottimale è sempre stocastica (ovvero una mappa dagli stati a una distribuzione di probabilità sulle azioni) se anche l'ambiente è stocastico? Intuitivamente, se l'ambiente è deterministico (cioè, se l'agente è in uno stato SSs e interviene un'un'a , allora lo stato successivo S'S's' è sempre la stessa, senza …
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.