Secondo "Efficient Backprop" di LeCun et al (1998) è buona norma normalizzare tutti gli input in modo che siano centrati attorno a 0 e rientrino nell'intervallo della seconda derivata massima. Quindi, per esempio, useremmo [-0.5,0.5] per la funzione "Tanh". Questo per aiutare il progresso della retro-propagazione man mano che l'Assia diventa più stabile.
Tuttavia, non ero sicuro di cosa fare con i neuroni del raddrizzatore che sono max (0, x). (Anche con la funzione logistica da allora vorremmo qualcosa come [0.1.0.9] tuttavia che non sia centrato su 0)