Sembra che la definizione di apprendimento supervisionato sia un sottoinsieme dell'apprendimento di rinforzo, con un particolare tipo di funzione di ricompensa che si basa su dati etichettati (al contrario di altre informazioni nell'ambiente). È una rappresentazione accurata?