Una tecnica di elaborazione del segnale, il Cepstrum di frequenza Mel , viene spesso utilizzata per estrarre informazioni da un brano musicale da utilizzare in un'attività di apprendimento automatico. Questo metodo fornisce uno spettro di potenza a breve termine e i coefficienti vengono utilizzati come input.
Nel progettare i sistemi di recupero della musica, tali coefficienti sono considerati caratteristici di un brano (ovviamente non necessariamente unico, ma distintivo). Ci sono delle caratteristiche che meglio si adattano all'apprendimento con una rete? Le caratteristiche variabili nel tempo come la progressione dei bassi del pezzo usato in qualcosa come una rete Elman funzionerebbero in modo più efficace?
Quali caratteristiche formerebbero un insieme sufficientemente ampio su quale classificazione potrebbe aver luogo?