Sono un neofita della rete neurale e sto cercando di capire matematicamente cosa rende le reti neurali così brave nei problemi di classificazione.
Prendendo l'esempio di una piccola rete neurale (ad esempio, una con 2 ingressi, 2 nodi in uno strato nascosto e 2 nodi per l'output), tutto ciò che hai è una funzione complessa all'uscita che è per lo più sigmoide su una combinazione lineare del sigmoide.
Quindi, come li rende bravi nelle previsioni? La funzione finale porta a una sorta di adattamento della curva?