1
Perché non vedi i livelli di abbandono negli esempi di apprendimento del rinforzo?
Ho studiato l'apprendimento per rinforzo e in particolare ho cercato di creare i miei ambienti da utilizzare con l'IA di OpenAI Gym. Sto usando gli agenti del progetto stable_baselines per testarlo. Una cosa che ho notato praticamente in tutti gli esempi di RL è che non sembra esserci mai alcun …