Ho letto in alcuni punti che la musica è per lo più campionata a 44,1 kHz mentre possiamo ascoltare solo fino a 20 kHz. Perché è?
Ho letto in alcuni punti che la musica è per lo più campionata a 44,1 kHz mentre possiamo ascoltare solo fino a 20 kHz. Perché è?
Risposte:
Si noti che la logica è pubblicata in molti luoghi: Wikipedia: perché 44,1 kHz?
44.100 è stato scelto da Sony perché è il prodotto dei quadrati dei primi quattro numeri primi. Questo lo rende divisibile per molti altri numeri interi , che è una proprietà utile nel campionamento digitale.
44100 = 2^2 * 3^2 * 5^2 * 7^2
Come hai notato, 44100 è anche appena al di sopra del limite dell'udito umano raddoppiato. La parte appena sopra offre ai filtri un certo margine di manovra, rendendoli quindi meno costosi (meno chip scartati).
Come Russell sottolinea nei commenti, il divisibile per molti altri numeri interi ha avuto un beneficio immediato al momento della scelta della frequenza di campionamento. I primi audio digitali sono stati registrati su supporti di registrazione video analogici esistenti che supportavano, a seconda della regione, le specifiche video NTSC o PAL . NTSC e PAL avevano tassi di linee per campo e campi al secondo diversi, il cui LCM (insieme ai campioni per linea) è 44100 .
La frequenza di Nyquist è superiore al doppio del limite di banda di un segnale in banda base che si desidera acquisire senza ambiguità (ad es. Aliasing).
Effettua il campionamento a una frequenza inferiore rispetto al doppio di 20kHz e non sarai in grado di distinguere tra frequenze molto alte e molto basse solo osservando i campioni, a causa dell'aliasing.
Aggiunto: si noti che qualsiasi segnale a lunghezza finita ha un supporto infinito nel dominio della frequenza, quindi non è strettamente limitato. Questo è un altro motivo per cui è necessario campionare qualsiasi sorgente audio non infinita un po 'al di sopra del doppio degli spettri di frequenza più alta (in un segnale in banda base) per evitare un aliasing significativo (al di là delle ragioni del roll-off di transizione del filtro finito).
Ciò di cui hai bisogno in teoria non è ciò che è richiesto in pratica. Questo segue la citazione (attribuita a molti):
In teoria non c'è differenza tra teoria e pratica. In pratica c'è.
Non sono un esperto di audio, ma sono stato addestrato da persone di campionamento / compressione audio di alta qualità. La mia conoscenza potrebbe essere arrugginita, prenderla con cautela.
In primo luogo, la teoria del campionamento standard funziona con alcuni presupposti: sistemi lineari e invarianza temporale. Quindi, in teoria, è noto che un fenomeno di bandlimited continuo può essere campionato a circa il doppio della larghezza di banda (o il doppio della frequenza massima per i segnali in banda base) senza perdita. Il "tasso di Nyquist" è spesso definito come:
la frequenza minima alla quale un segnale può essere campionato senza introdurre errori
Questa è la parte di analisi del "teorema del campionamento". Il "può essere" è importante. C'è una parte di sintesi: il segnale continuo " può essere ricostruito" analogamente usando i cardinali. Questa non è l'unica tecnica e non tiene conto del prefiltro passa-basso, non lineare (come quantizzazione, saturazione) e altri fattori di variazione del tempo.
L'udito umano non è un argomento semplice. È accettato che gli umani sentano frequenze da 20 Hz a 20.000 Hz. Ma limiti così precisi in Hertz non sono una caratteristica della natura per tutti gli umani. Una graduale perdita di sensibilità alle frequenze più alte è frequente con l'età. Dall'altro lato:
In condizioni ideali di laboratorio, gli esseri umani possono sentire suoni a partire da 12 Hz e fino a 28 kHz, sebbene la soglia aumenti drasticamente a 15 kHz negli adulti
L'udito non è lineare: ci sono soglie di audizione e sofferenza . Non è invariante nel tempo. Ci sono effetti di mascheramento sia nel tempo che nella frequenza.
Esistono altre opzioni: il formato DAT, ad esempio, è stato rilasciato con campionamento a 48 kHz, con una conversione inizialmente difficile. 96 kHz è discusso rispetto alla quantizzazione (o profondità di bit) in Quale frequenza di campionamento e profondità di bit dovrei usare? Questo è un argomento controverso, vedi 24 bit 48kHz contro 24 bit 96kHz . Ad esempio, puoi controllare le frequenze di campionamento di Audacity .
Perché è esattamente 44,1 kHz è già stata data risposta - ma per concentrarsi sull'aspetto della tua domanda relativa al limite della percezione umana, la ragione è abbastanza semplice.
La risoluzione nel tempo deve essere abbastanza buona da essere in grado di generare tutte le possibili forme d'onda fino al limite percepibile. Secondo il teorema del campionamento , la risoluzione deve essere tale che la frequenza di campionamento sia almeno il doppio di questa frequenza. Intuitivamente, alla massima frequenza, sono necessari almeno 2 punti per rappresentare il massimo e il minimo del segnale, dando a questa onda quadra Ascii-art:
_ _
|_| |_
Al fine di riprodurre fedelmente un segnale, più veloce è la frequenza di campionamento, meglio è. È stato scelto ~ 40 kHz, perché era una bassa frequenza di campionamento per cui la maggior parte delle persone non è in grado di dire la differenza (quando ricostruita). Quando fu introdotto il campionamento audio, la memoria e l'archiviazione erano costose e frequenze di campionamento più elevate non erano possibili a buon mercato.
Al doppio del limite superiore dell'udito umano due campioni per ciclo è una ricostruzione molto scadente, anche se soddisfa i criteri di Nyquist per i segnali di campionamento, un semplice grafico che rappresenta un'onda sinusoidale con due campioni per ciclo mostrerà quanto sono poveri due campioni per ciclo nel riprodurre una forma d'onda. Puoi letteralmente trasformare un'onda sinusoidale in onda quadra; è una buona cosa a 20 kHz nessuno può dirlo. Scommetto che un cane potrebbe però.