Grazie per il riferimento! Hai dimenticato di menzionare il tuo lavoro sul potenziamento della batteria , che potrebbe anche interessare l'applicazione Summer_More_More_Tea. Bene, tutto dipende davvero da cosa vuoi farci. Hai in mente una specifica "applicazione finale"?
Sono completamente d'accordo con le affermazioni di cui sopra. Per essere completo, dovrei comunque dire che il potenziamento vocale che hai citato è stato usato anche in alcuni lavori di Matti Ryynänen, sulla generazione di brani di Karaoke, per migliorare i risultati.
Per rispondere alle tue domande:
Data l'efficacia, quale è preferito (o qualsiasi altra soluzione :)?
Come dicevano le pichenette, nessuna delle due sembra soddisfare le tue esigenze: il filtro passa-basso / passa-alto fallirà a causa della struttura armonica della voce umana (e più in generale di qualsiasi suono "interessante" - cioè qualsiasi cosa oltre i sinusoidi ... ).
Se il 2 °, lasciare due canali A e B, verranno utilizzati (BA) o (AB) quando si calcola lo sfondo? Come con l'unione di due canali, l'aritmetica significa abbastanza accurata?
Ancora una volta, il secondo metodo che menzionerai non funzionerà perché puoi solo rimuovere il segnale che si trova al centro, non recuperarlo. In altre parole, anche la voce è al "centro", non esiste una semplice matematica per ottenere un segnale solo vocale.
Oppure posso sottocampionare ciascun canale di un fattore due e interlacciare i segnali sottocampionati come risultato mono?
er ... la media dei canali per ottenere un segnale mono-canale, come suggerito sopra, ha senso e non romperà le caratteristiche spettrali del tuo segnale (supponendo che il segnale stereo non sia degenerato). Quindi ottieni un segnale mono in cui hai, fondamentalmente, lo stesso contenuto musicale di prima.
Il downsampling corretto di ciascun canale significa che si applica prima un filtro passa-basso (con frequenza di taglio di sampling_rate / 4 nel proprio caso), quindi è possibile prelevare in sicurezza ogni 2 campioni. Tuttavia, non c'è molto da dire sull'interleaving dei canali così sottocampionati: nella maggior parte dei casi, ciò rompe le caratteristiche spettrali del segnale. Probabilmente non lo vuoi.
In effetti, l'operazione di filtro passa-basso seguiva l'impostazione di 0 ogni 2 campioni e il mantenimento di questi 0 conduce, nel dominio di Fourier, al "mirroring" dei componenti a bassa frequenza che sono stati mantenuti su quelli ad alta frequenza. Ricorda che tieni lezioni di elaborazione del segnale sulla teoria del campionamento: la moltiplicazione per una sequenza di impulsi (o dirac) si traduce in una convoluzione con un'altra sequenza di dirac nel dominio di Fourier, ovvero, in tal caso, lo spettro di frequenza del segnale viene ripetuto (periodizzato) lungo l'asse della frequenza, con un periodo pari alla frequenza di campionamento.
Normalmente, quando si esegue il downsampling, si rimuovono gli 0 (poiché si presume una nuova frequenza di campionamento). Ma qui, mantenerli si traducono in fastidiosi componenti aggiuntivi ad alta frequenza. Interlacciare questi segnali non correggerà questo.
Bene, tutto sommato, la risposta breve: non farlo . :-)
Infine, potrei anche suggerirti di usare la GUI che ho sviluppato per la conferenza LVAICA 2012: c'è un repository git per questo. Sto ancora eseguendo il debug e migliorandolo, quindi i commenti sono ben accetti: D
Spero possa aiutare!