Quanti esempi di allenamento sono troppo pochi quando si allena una rete neurale?


14

Sono un principiante che prova a mettere insieme il mio primo progetto. Avevo in mente un progetto di classificazione delle canzoni, ma dato che avrei etichettato manualmente, ho potuto ragionevolmente mettere insieme circa 1000 canzoni o 60 ore di musica.

Mi classificherei con diverse classi, quindi è possibile che una classe abbia un minimo di 50-100 canzoni nel set di formazione, questo sembra troppo poco! Esiste una regola empirica generale per quanti dati sono necessari per addestrare una rete neurale per provarci a lavorare?

Modifica: stavo pensando di usare un LSTM alla vaniglia. Le funzionalità di input avranno dimensione 39, dimensione output 6, il mio primo tentativo di dimensione layer nascosta sarebbe 100.


2
Questo non è realmente responsabile perché non tutte le attività sono facili e diverse architetture di rete e selezioni di iperparametri miglioreranno / danneggeranno diversi modelli in modi diversi.
Sycorax dice di ripristinare Monica

Come minimo, è necessario specificare la struttura della rete e il numero di collegamenti che saranno disponibili per la formazione.
gung - Ripristina Monica

Risposte:


16

Dipende molto dal set di dati e dall'architettura di rete. Una regola empirica che ho letto (2) era di alcune migliaia di campioni per classe affinché la rete neurale potesse iniziare a funzionare molto bene.

In pratica, le persone cercano di vedere. Non è raro trovare studi che mostrano risultati decenti con un set di addestramento inferiore a 1000 campioni.


Un buon modo per valutare approssimativamente in che misura potrebbe essere utile avere più campioni di allenamento è tracciare le prestazioni della rete neurale in base alle dimensioni del set di addestramento, ad esempio da (1):

inserisci qui la descrizione dell'immagine


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.