Come si può determinare il tasso di apprendimento ottimale per la discesa gradiente? Sto pensando che potrei regolarlo automaticamente se la funzione di costo restituisce un valore maggiore rispetto alla precedente iterazione (l'algoritmo non converge), ma non sono davvero sicuro di quale nuovo valore dovrebbe prendere.