La trascrizione musicale polifonica al momento non sembra essere un problema risolto.
Che ne dici dell'inverso di una piccola parte del problema. Esistono tipi di caratteristiche spettrali (da una STFT) che possono essere utilizzate per eliminare alcuni accordi musicali dallo spazio delle probabilità? (ad esempio, questo frammento di suono molto probabilmente non contiene alcun accordo C # o alcun tipo di accordo minore diminuito, oppure questa è una singola nota non un accordo, ecc.)
Supponiamo che lo snippet audio sia più o meno stazionario (attacco transitorio rimosso, ecc.) E che molto probabilmente siano presenti sovratoni per la maggior parte o tutte le singole note. (E questa domanda non riguarda gli accordi invertiti.)