8
Scelta di un tasso di apprendimento
Attualmente sto lavorando all'implementazione della Discesa stocastica del gradiente SGD, per le reti neurali che usano la propagazione di ritorno, e mentre capisco il suo scopo ho alcune domande su come scegliere i valori per il tasso di apprendimento. Il tasso di apprendimento è correlato alla forma del gradiente di …