Le orecchie delle persone possono sentire il suono le cui frequenze vanno da 20 Hz a 20 kHz. Basato sul teorema di Nyquist, la velocità di registrazione dovrebbe essere di almeno 40 kHz. È la ragione per scegliere 44.1 kHz?
Le orecchie delle persone possono sentire il suono le cui frequenze vanno da 20 Hz a 20 kHz. Basato sul teorema di Nyquist, la velocità di registrazione dovrebbe essere di almeno 40 kHz. È la ragione per scegliere 44.1 kHz?
Risposte:
È vero che, come ogni convenzione, la scelta di 44.1 kHz è una specie di incidente storico. Ci sono alcune altre ragioni storiche.
Naturalmente, la frequenza di campionamento deve superare i 40 kHz se si desidera un audio di alta qualità con una larghezza di banda di 20 kHz.
Si è discusso di renderlo a 48.0 kHz (era ben congruente con 24 fotogrammi / secondo film e gli apparenti 30 fotogrammi / secondo nella TV nordamericana), ma data la dimensione fisica di 120 mm, c'era un limite a quanti dati il Il CD potrebbe contenere, e dato che era necessario uno schema di rilevamento e correzione degli errori e che richiede una certa ridondanza nei dati, la quantità di dati logici che il CD potrebbe archiviare (circa 700 MB) è circa la metà della quantità di dati fisici. Alla luce di tutto ciò, al ritmo di 48 kHz, ci è stato detto che non poteva contenere tutto il nono di Beethoven, ma che poteva contenere l'intero nono su un disco a un ritmo leggermente più lento. Quindi 48 kHz sono fuori.
Tuttavia, perché 44.1 e non 44.0 o 45.0 kHz o qualche bel numero di round?
Allora, alla fine degli anni '70, esisteva un prodotto chiamato Sony F1, progettato per registrare audio digitale su nastro video prontamente disponibile (Betamax, non VHS). Quello era a 44.1 kHz (o più precisamente 44.056 kHz). In questo modo sarebbe facile trasferire le registrazioni, senza ricampionamento e interpolazione, dalla F1 al CD o nella direzione opposta.
La mia comprensione di come ci arriva è che la velocità di scansione orizzontale della TV NTSC era di 15,750 kHz e 44,1 kHz è esattamente 2,8 volte quella. Non sono del tutto sicuro, ma credo che ciò significhi che puoi avere tre coppie di campioni stereo per linea orizzontale, e per ogni 5 linee, dove normalmente avresti 15 campioni, ci sono 14 campioni più un campione aggiuntivo per alcuni controllo di parità o ridondanza in F1. 14 campioni per 5 linee equivalgono a 2,8 campioni per linea orizzontale e con 15.750 linee al secondo, che risulta essere 44.100 campioni al secondo.
Ora, da quando è stata introdotta la TV a colori, hanno dovuto ridurre leggermente la velocità della linea orizzontale a 15734 linee al secondo. Tale regolazione porta a 44.056 campioni al secondo nella Sony F1.
Guarda ad esempio http://www1.cs.columbia.edu/~hgs/audio/44.1.html . È necessario utilizzare una frequenza di campionamento superiore a 40 kHz a causa dei filtri anti-aliasing. Dovresti avere un po 'di riserva in frequenza per prevenire la distorsione del segnale dovuta alla pendenza di risposta del filtro. Il valore effettivo di 44,1 kHz è stato suggerito da Sony corp quando lo standard di registrazione audio era in discussione nel 1979. Hanno usato questa frequenza ampiamente per quel momento.
Quindi è generalmente una ragione storica.
Nel passaggio ai formati digitali, l'audio veniva archiviato in una forma d'onda pseudo-video che poteva essere vista in bianco o nero (che rappresenta il formato binario).
La frequenza di campo e la struttura utilizzate dallo standard televisivo sono le seguenti per i video a 60 Hz: 245 linee per campo (escluse le prime 35 linee cancellate). Con tre campioni per riga che produce 60 x 245 x 3 = 44100 = 44,1 KHz.
Questa convenzione è stata successivamente utilizzata per il formato CD, a causa di problemi di compatibilità delle apparecchiature (la prima apparecchiatura utilizzata per produrre master CD utilizzati per la replica di CD era basata su video).
Sembra che il limite di ascolto per gli umani potrebbe essere molto più alto di 20kHz se guardato da una prospettiva di risoluzione temporale "dinamica" piuttosto che dalle tipiche onde sinusoidali statiche. Interessanti anche i commenti sul margine tra 20kHz e 22 kHz per il filtro di ricostruzione. In realtà c'è stato un lavoro molto interessante di Peter Craven sul filtro ottimizzato nel dominio del tempo che sostiene almeno 96kHz per la riproduzione hi-fi.
Pawel
https://en.wikipedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F Il teorema di campionamento di Nyquist-Shannon afferma che la frequenza di campionamento deve essere maggiore del doppio della frequenza massima che si desidera riprodurre. Poiché l'intervallo dell'udito umano è compreso tra circa 20 Hz e 20.000 Hz, la frequenza di campionamento doveva essere superiore a 40 kHz.
Inoltre, i segnali devono essere filtrati passa-basso prima del campionamento per evitare l'aliasing. Mentre un filtro passa basso ideale passerebbe perfettamente frequenze inferiori a 20 kHz (senza attenuarle) e taglierebbe perfettamente le frequenze sopra 20 kHz, tale filtro ideale è teoricamente impossibile (è non causale), quindi in pratica è necessaria una banda di transizione, dove le frequenze sono parzialmente attenuate. Più ampia è questa banda di transizione, più facile ed economico è realizzare un filtro anti-aliasing. La frequenza di campionamento di 44,1 kHz consente una banda di transizione di 2,05 kHz.
Inoltre, 44.100 è il prodotto dei quadrati dei primi quattro numeri primi (2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2) e quindi ha molti piccoli fattori utili.
Cerca [ http://batmobile.blogs.ilrt.org/audio-analysis-on-an-iphone per la descrizione. Un teorema chiamato teorema di campionamento di Nyquist afferma che per campionare un segnale di X Hz senza una significativa perdita di qualità, è necessario campionare a 2 volte la frequenza. Il limite dell'udito umano è di circa 20 kHz, che quindi richiede una frequenza di campionamento di circa 40 KHz. Ecco perché i CD vengono campionati a 44Khz. cioè ogni secondo di registrazione su un CD contiene 44.000 misurazioni della più alta frequenza possibile contenuta nella registrazione.