Roadmap di apprendimento per principianti nell'elaborazione del segnale audio

13

Vorrei iniziare a imparare l'elaborazione del segnale audio. Ci sono numerosi libri online e documenti accademici che sembrano saltare i fondamenti dell'argomento.

Vorrei conoscere una roadmap approssimativa, per così dire, da seguire per apprendere con successo l'elaborazione del segnale audio.

Ho letto che il calcolo è il primo passo prima di iniziare con l'analisi del segnale.

Mi sembra che l'analisi del segnale audio sia solo una parte delle conoscenze generali necessarie. Dove altri argomenti sono la teoria musicale, l'ingegneria audio e la programmazione.

Se potessi chiedere alle persone con conoscenza in quest'area di suggerire possibili passi verso la comprensione di come analizzare e manipolare / creare segnali audio.

audio

— Jarryd
fonte

Concordo sul fatto che uno sfondo nel calcolo (come minimo) sarà importante per te avere la possibilità di comprendere la matematica che potresti incontrare in un testo o in un corso di teoria dei segnali e dei sistemi. Per prima cosa mi assicurerei che tu abbia intenzione di fiutare lì.

— Jason R,

1

Queste diapositive potrebbero aiutare. Comprendono alcune delle basi non matematiche / ingegneristiche dell'elaborazione e della programmazione audio. blog.bjornroche.com/2011/11/…

— Bjorn Roche,

17

Consiglio di dare un'occhiata all'elaborazione del segnale audio fisico del Prof. Julius O. Smith III . È disponibile online o può essere acquistato tramite il servizio di stampa su richiesta di Amazon.

In particolare, potrebbe essere utile la descrizione nella Panoramica delle serie di libri .

inserisci qui la descrizione dell'immagine

— Peter K.
fonte

9

Non credo che ci sia motivo di immergersi nella complessità di DFT / FFT / IIR / FIR e wavelet senza prima capire che cosa sia fondamentalmente l'audio e quali siano i vari modi di rappresentare l'audio in digitale.

Cos'è l'audio in generale (nell'aria, non nell'acqua o in altri materiali):

L'audio è composto da onde di pressione sonora
Causano compressione e rarefazione dell'aria
Queste onde si propagano verso l'esterno dal punto di origine
Le onde possono interferire tra loro causando picchi e depressioni
Le onde possono essere assorbite e riflesse dai materiali

Come viene rappresentato elettricamente l'audio:

Un microfono e un preamplificatore converte le onde di pressione sonora in un segnale elettrico
In genere questo segnale ha una tensione sia positiva che negativa (come le tensioni CA)
I nastri magnetici memorizzano queste differenze così come appaiono, da cui il termine analogo
La saturazione si verifica quando la potenza del segnale di ingresso è uguale ai limiti del sistema (non è possibile rappresentare con precisione altri aumenti di tensione)
Il clipping si verifica quando il segnale di input è più alto di quello che può essere rappresentato dal sistema, quindi il segnale viene troncato (o limitato alle estremità)

Come viene rappresentato l'audio in modo digitale:

L'audio deve essere prima campionato con un ADC (convertitore da analogico a digitale)
Il campionamento comprende la misurazione elettrica periodica di un segnale audio
Questo periodo è chiamato frequenza di campionamento e determina la frequenza più alta che può essere rappresentata (limite di nyquist)
Il limite di nyquist è la frequenza di campionamento / 2 (più si avvicina al limite, più il segnale diventa scarsamente rappresentato)
Il bitrange determina il rumore di fondo, (-96dB per 16 bit contro -48dB per 8 bit)
Un singolo campione di audio a 16 bit può essere un valore (con segno) compreso tra -32768 e 32767 (ciò può rappresentare sia l'oscillazione negativa che quella positiva del segnale analogico)
Sono consentiti solo 8 bit per byte (in termini di memoria del computer), quindi un campione a 16 bit deve essere rappresentato da almeno 2 byte
L'ordine in cui sono memorizzati questi byte è indicato come il loro tipo endian (grande o piccolo)
I campioni stereo richiedono un campione separato per ciascun canale, uno per sinistra e un altro per destra

Quali modi diversi sono utilizzati per archiviare l'audio digitale:

PCM (pulsato modulato) è il modo non compresso più comune per archiviare l'audio in digitale
Esistono molte compressioni per ridurre la quantità di dati utilizzati, alcuni sono senza perdita, altri con perdita
I file WAV non sono compressi e possono essere mono o stereo (campioni interlacciati)
I file MP3 sono compressi, con perdita di dati e utilizzano la psicoacustica per ottenere tassi di compressione dei dati molto elevati
Anche l'intervallo di bit più basso (1 bit) può essere utile a seconda del loro utilizzo, in genere buoni regalo che riproducono l'audio memorizzato come 1 bit

Come acquisire maggiore familiarità con l'audio nel regno digitale:

Fai e fai di più! Scarica un programma come audacity e crea file audio diversi utilizzando frequenze di campionamento e intervalli di bit diversi
Crea toni sinusoidali / triangolari / quadrati e a dente di sega e ascolta le differenze
Impara a sentire la differenza tra tipi come un file 10KHz a 8 bit e un file 44.1KHz a 16 bit (qualità CD)
Sperimenta con i filtri passa-alto / passa-basso / passa-banda e ascolta le differenze
Spingere i segnali oltre il limite di saturazione per capire in che modo il clipping influenza il segnale audio
Applica buste ai segnali se il tuo software ha questa capacità
C'è una differenza tra distorsione armonica e armonica, sperimentare con entrambi
Utilizzare uno spettrogramma (FFT) per vedere questi e altri segnali per acquisire familiarità con essi
Usa grafici sia lineari che logaritmici per vedere le differenze
Effettua il downsampling e il upcampionamento dei segnali e ascolta come ciò influisce sull'audio
Utilizzare diversi metodi di dithering (durante la conversione di intervalli di bit) e ascoltare le differenze

Si spera che questo ti dia un'idea di cosa sia l'audio rappresentato digitalmente e di come suonino le differenze prima di provare qualsiasi DSP. È sempre più facile sapere che qualcosa non va nell'analisi FFT se si può riconoscere che è stato immesso, ad esempio, un segnale a 8 bit contro un segnale a 16 bit o che la frequenza di campionamento è stata corrotta da un errore di calcolo errato in una trasformazione.

— ronnied
fonte

Grazie per la risposta. Sono consapevole di queste cose però e vorrei entrare nel lato di codifica dsp di esso ora.

— Jarryd,