Quali sono gli equivalenti audio di immagini come "Lena", "Mandrill" e "Cameraman"?


Risposte:


17

L'esempio più vicino a cui riesco a pensare è l'inizio del "Tom's Diner" di Suzanne Vega, che è stato utilizzato per lo sviluppo del livello 3 di mpeg-1, ed è ancora occasionalmente usato per demo di codec audio.


3
sì, Tom's Diner è un frammento di voce cantante ragionevolmente pulito (privo di riverbero) e monofonico utile per testare i programmi di rilevamento del tono. un altro è una clip di Boyz II Men sulla loro copertina del "Ieri" dei Beatles (proprio alla fine). buono per il pitch tracking di una voce monofonica. è più duro di Tom's Diner. ricordo che Digital Performer l'ha usato.
robert bristow-johnson,

16

L'elaborazione audio è un campo ampio, ma in particolare nell'elaborazione vocale, viene ampiamente utilizzato un database aperto di campioni noto come Harvard Sentences . Le frasi di Harvard sono raccolte equilibrate di frasi in inglese americano. Esistono molti database equivalenti anche per altre lingue.

I file effettivi con il discorso di Harvard Sentences sono disponibili qui .


5

Penso anche che il database NIST sia molto popolare quando si tratta di compiti di riconoscimento vocale. In realtà è uno standard per il confronto di nuovi algoritmi e tecniche durante le sfide annuali.

Inoltre, lo load handelsnippet contenente MATLAB di GFHandel - Alleluia è abbastanza comunemente usato.



2

Non sottovalutare la potenza dell'onda sinusoidale 1 kHz a 0 dBFS. In mono. Molte cose che non vanno nei percorsi del segnale possono essere trovate con quello.

Ho costruito e calibrato abbastanza sistemi audio che posso fischiare esattamente 1 kHz. Dalla semplice memoria.

Oltre a ciò, IGY di Donald Fagen è così popolare come pista di prova che è stato proibito da numerosi festival.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.