L'attuale stato dell'arte nell'interpolazione del segnale audio


11

Tre domande:

  1. Quali sono tutte le metriche che è possibile utilizzare per misurare oggettivamente la qualità dell'interpolazione audio? (ma anche in termini di psicoacustica, se possibile)

  2. In base a tali parametri, qual è lo stato dell'arte attuale nell'interpolazione audio?

  3. Supponiamo che dovessi eseguire il rendering di due file da una sequenza di note da strumenti virtuali in due risoluzioni e quindi confrontare un upsampling di un file con la versione renderizzata ad alta frequenza, quale software si potrebbe usare per confrontare questi oggettivamente? - idealmente utilizzando le metriche sopra menzionate

Finora, da quando sono stato in grado di riunirmi, questi ricampionatori offrono la migliore qualità

  1. http://www.mega-nerd.com/SRC/
  2. http://sox.sourceforge.net/SoX/
  3. http://www.izotope.com/tech/src/

Uno dei problemi che questi ricampionatori sembrano avere è pre e post squillo.

Dovrei notare che di fondamentale interesse è la ricostruzione del segnale (nella misura in cui questo termine ha un senso), quindi il sovracampionamento più che il ricampionamento.

Modifica: l'efficienza temporale dell'interpolazione è irrilevante in questo contesto.

Cordiali saluti, I curiosi :-)

Risposte:


5

Per quanto riguarda il "problema" che noti con i ricampionatori:

Molti algoritmi di ricampionamento usano un kernel di interpolazione polifase con filtro passa-basso a fase lineare. Un kernel di interpolazione del filtro in fase minima, al contrario del kernel di interpolazione in fase lineare (con la stessa risposta in frequenza), produrrebbe meno pre-squillo durante il ricampionamento a una frequenza di campionamento più elevata, che potrebbe oggettivamente misurare come meno preciso, ma forse psicopatico acusticamente "meglio" per l'uomo.

Ecco una nota sulla creazione di filtri di fase minimi per il filtraggio con un pre-squillo potenzialmente inferiore: http://www.music.columbia.edu/pipermail/music-dsp/2004-February/059372.html

Inoltre, un filtro passa-basso progettato da Remez (Parks-McClellan) può avere una chiara ondulazione periodica nel dominio della frequenza, che potrebbe anche produrre un impulso pre-ring nel dominio del tempo. Quindi potresti voler provare invece un Sinc con finestra, o una derivazione di un filtro analogico classico, per il design del filtro passa-basso (quest'ultimo di solito si traduce in qualcosa di più vicino alla fase minima) per il kernel di interpolazione del ricampionamento.


Per quanto riguarda il punto sui filtri di fase minima: non sono sicuro dei primi due collegamenti, ma l'SRC di iZotope consente una fase continuamente variabile tra minimo e lineare. Nei test di ascolto, le persone tendono a preferire un punto tra la fase minima e la fase lineare.
schnarf,

Un filtro sinc-finestra non sarebbe necessariamente migliore di un filtro equiripple (progettato tramite scambio Remez) per quanto riguarda lo squillo nel dominio del tempo. L'effetto di squillo si chiama fenomeno di Gibbs e si osserva quando si limita la banda di un segnale che contiene discontinuità (ad esempio un'onda quadra). Non è causato dall'ondulazione del dominio di frequenza di un filtro equiripple. L'effetto è più evidente quando si utilizzano filtri con cutoff molto nitido; l'aumento della larghezza di transizione può mitigarlo in qualche modo.
Jason R,

@Jason R: sinusoide nel dominio del tempo = impulso nel dominio della frequenza, posizione dipendente dalla frequenza di ondulazione della sinusoide. Ora inverti i 2 domini e metti un'ondulazione di tipo sinusoidale in una risposta del dominio di frequenza. L'impulso entra nel dominio del tempo, la posizione dipende dalle caratteristiche dell'ondulazione.
hotpaw2

@ hotpaw2: vedo la tua analogia. Ho frainteso l'intento del tuo termine "impulso pre-ring".
Jason R,

Inoltre, una finestra liscia nel dominio del tempo riproduce la sua forma non discontinua attorno alle discontinuità nel dominio della frequenza per convoluzione, riducendo così il superamento di Gibbs.
hotpaw2

6

Esiste un confronto abbastanza approfondito degli algoritmi di ricampionamento: http://src.infinitewave.ca/

Puoi vedere i test che hanno usato lì. L'aliasing è grande ed è facile da visualizzare con uno spettrogramma di una scansione sinusoidale. C'è anche una risposta ad alta frequenza - SRC può far decollare le alte frequenze oltre a consentire loro di causare aliasing. È possibile visualizzare la risposta di fase con il grafico della risposta all'impulso o con un grafico della risposta di fase.


Sì, conosco questa eccellente risorsa. Volevo solo conoscere tutti i parametri che vale la pena misurare quando si misurano le prestazioni di ricampionamento (in particolare il ricampionamento).
Bent Rasmussen,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.