Un estraneo al campo ML / DL; ha iniziato il corso Udacity Deep Learning basato su Tensorflow; fare l'incarico 3 problema 4; cercando di ottimizzare la frequenza di apprendimento con la seguente configurazione:
- Dimensione del lotto 128
- Numero di passaggi: sufficiente per riempire 2 epoche
- Dimensioni degli strati nascosti: 1024, 305, 75
- Inizializzazione del peso: troncata normale con std. deviazione di sqrt (2 / n) dove n è la dimensione del livello precedente
- Probabilità di abbandono: 0,75
- Regolarizzazione: non applicata
- Algoritmo del tasso di apprendimento: decadimento esponenziale
giocato con i parametri del tasso di apprendimento; non sembrano avere effetti nella maggior parte dei casi; codice qui ; i risultati:
Accuracy learning_rate decay_steps decay_rate staircase
93.7 .1 3000 .96 True
94.0 .3 3000 .86 False
94.0 .3 3000 .96 False
94.0 .3 3000 .96 True
94.0 .5 3000 .96 True
- Come devo regolare sistematicamente il tasso di apprendimento?
- In che modo il tasso di apprendimento è correlato al numero di passaggi?