Sono un principiante che prova a mettere insieme il mio primo progetto. Avevo in mente un progetto di classificazione delle canzoni, ma dato che avrei etichettato manualmente, ho potuto ragionevolmente mettere insieme circa 1000 canzoni o 60 ore di musica.
Mi classificherei con diverse classi, quindi è possibile che una classe abbia un minimo di 50-100 canzoni nel set di formazione, questo sembra troppo poco! Esiste una regola empirica generale per quanti dati sono necessari per addestrare una rete neurale per provarci a lavorare?
Modifica: stavo pensando di usare un LSTM alla vaniglia. Le funzionalità di input avranno dimensione 39, dimensione output 6, il mio primo tentativo di dimensione layer nascosta sarebbe 100.