Supponiamo di voler fare una regressione per l' f = x * y
utilizzo semplice di una rete neurale profonda standardizzata.
Ricordo che ci sono delle ricerche che dicono che NN con uno strato hiden può apoximare qualsiasi funzione, ma ho provato e senza normalizzazione NN non è stato in grado di approssimare nemmeno questa semplice moltiplicazione. Solo la normalizzazione dei dati dei log ha aiutato, m = x*y => ln(m) = ln(x) + ln(y).
ma sembra un imbroglio. NN può farlo senza log-normalizzazione? La risposta è ovviamente (come per me) - sì, quindi la domanda è più cosa dovrebbe essere tipo / configurazione / layout di tale NN?