Puoi rappresentare un segnale audio in altri domini oltre a tempo e frequenza?

8

Forse una domanda stupida, ma se esiste una rappresentazione nel dominio del tempo del segnale audio, e anche nel dominio della frequenza, esiste un altro dominio in cui il segnale può essere rappresentato?

audio

— apocalisse
fonte

3

Cepstrum è molto utile per alcune applicazioni.

— Serge

8

L'audio esiste davvero solo nel dominio del tempo, nell'audio lo traduciamo in somma di onda sinusoidale perché quella relativa al modo in cui ascoltiamo i suoni. Esistono altri modi in cui i suoni possono essere interpretati, tutto dipende dal fatto che quella rappresentazione ti sia utile. Le cose che potresti trovare interessanti sono: wavelet, sintesi granulari, sintesi formanti, ricordo di aver letto qualcosa che funziona rappresentando il suono una sorta di sintesi granulare in cui ogni granulo era fatto della serie armonica naturale, penso che si chiamasse sintesi risonante.

— Nathan Day
fonte

13

Fondamentalmente si tratta di scomporre le informazioni in diversi "bit". Il segnale audio effettivo è un "valore" che varia nel tempo, tuttavia spesso è utile considerarlo in una forma diversa. Come analogia, considera il numero 256: a seconda di cosa stai facendo con i tuoi numeri, potrebbe essere utile trattare il numero come 200 + 50 + 6, oppure 16 + 240, oppure 16*16, o forse come 2^8; ci sono un numero infinito di modi per trattare il numero e quale usi dipende da cosa stai cercando di ottenere.

La "rappresentazione del dominio della frequenza" è un esempio di come suddividere, ma con un segnale anziché un numero. In questo caso, stai rappresentando il segnale originale come una somma di sinusoidi, tutti con frequenze, ampiezze e fasi diverse. Se li aggiungi tutti insieme, ricevi il segnale originale. In alternativa, puoi scegliere di rappresentarlo in un modo diverso, ad esempio con wavelet o qualsiasi altro approccio che potrebbe o meno avere un nome (ancora), se è utile per quello che ci stai facendo. Forse potresti spezzarlo in pezzi di 3 secondi, quindi riorganizzare il segnale in ciascuno di quei pezzi per aumentare monotonicamente e ricordare come li hai riordinati. Sembra un po 'ridicolo, ma c'è un approccio alla manipolazione delle immagini MRI con questo tipo di riordino (non usa la parte di chunking,

Un vantaggio dei sinusoidi è che, come dice Nathan Day, si riferisce al modo in cui le nostre orecchie interpretano il tono dei suoni. Ma una ragione più importante è che i sinusoidi sono esponenziali complessi, che sono autofunzioni di sistemi lineari; vale a dire che i sistemi lineari sono molto più semplici da analizzare se si considerano gli input e gli output come somme di sinusoidi. Questo è il motivo principale per cui l'analisi di Fourier è così diffusa e importante.

Risposta breve alla tua domanda: ci sono un numero infinito di domini in cui puoi rappresentare un segnale audio. Per un altro popolare, vedi wavelet.

— lxop
fonte