Il comando haimgs non è completamente corretto. Classicamente esegui una panoramica riducendo il volume di un solo canale. Ciò significa: se si desidera che il segnale rimanga all'80%, il canale sinistro mantiene il volume originale mentre il canale destro ottiene solo il 20% del volume originale. Almeno questo è ciò che ha fatto il codice di panning di Sox (e ciò che Alan Blumlein sembra aver inventato quando ha inventato lo stereo).
Inoltre il suo comando può essere abbreviato usando l'opzione remix.
Pertanto il comando corretto e abbreviato è:
sox left.wav right.wav stereo.ogg remix 1,2v0.2 1v0.2,2
modifica in risposta al commento di haimgs:
sox ti avviserà se si verificano ritagli. Ma sì, è possibile. Con l'opzione remix ogni volume di canali viene ridimensionato con il fattore 1 / n, dove n è il numero di canali di ingresso. Ma viene usato solo se è stata specificata NESSUNA OPZIONE VULME per il canale di uscita (quindi il 100% + 20% è corretto).
sox ha anche un'opzione per ridimensionare qualsiasi canale senza informazioni esplicite sul volume, basta aggiungere un "-a" dopo "remix" (come "remix -a 1,2v0.2 1v0.2,2") e i volumi saranno come 50 % + 20% = 70%. È piuttosto confuso e ormai non so se devi ridimensionare anche il volume dei canali con panning di 1 / n, il che comporterebbe "remix -a 1,2v0.1 1v0.1,2" o 50% + 10% = 60%. Dovrò indagare ulteriormente in questa direzione. Nel frattempo puoi leggere la sezione remix nella pagina man di sox (disponibile anche nella homepage di sox ).
modifica dopo ulteriori riflessioni:
Dopo averci pensato, sono abbastanza sicuro che devi ridimensionare anche i volumi di panning di 1 / n.
Informazioni sul problema del ritaglio: dividendo TUTTI i volumi per il numero di canali, questo problema non può verificarsi. Ma ciò non preserva la potenza originale del segnale, perché la potenza di un segnale è logaritmica, non lineare. Più canali mescoli, più silenzioso dovrebbe diventare il segnale. Ecco perché sox ha anche opzioni per questo, in cui i volumi vengono ridimensionati di 1 / sqrt (n). Per usarlo, basta prendere una "p" invece di una "v" nella parte remix e regolare i valori di conseguenza, e aggiungere anche un'opzione "-p" dopo l'istruzione remix. Puoi vedere la differenza di ridimensionamento di 1 / n e di 1 / sqrt (n) qui .
Di seguito è come penso di calcolare i valori di potenza corretti: per ogni canale devi risolvere 20 * log_10 (fattore). Un fattore 2 comporterà ~ 6 (dB), un fattore 0,5 comporterà ~ -6 (dB). Questo è esattamente ciò che dice il manuale di Sox, quindi immagino che sia giusto.
Quindi, finalmente il comando nel tuo caso dovrebbe essere:
sox left.wav right.wav stereo.ogg remix -p -a 1,2p-6 1p-6,2
Non ho Sox su questa macchina, quindi non posso testare questo comando per la sintassi corretta, quindi per favore dimmi se c'è un problema. Metterò alla prova tutta questa teoria non appena ne avrò la possibilità, perché dovrò affrontare un problema simile, ma dovrò mescolare molti più canali oltre a solo 2, ed è per questo che mi sono inventato quella roba di potenza del segnale.