Quando devo calcolare il PSD anziché il semplice spettro di magnitudo FFT?


12

Ho un segnale vocale di trenta secondi che è stato campionato a 44,1 kHz. Ora, vorrei mostrare quali frequenze ha il discorso. Tuttavia, non sono sicuro di quale sarebbe il modo migliore per farlo. A volte sembra che si calcoli il valore assoluto di una trasformata di Fourier e talvolta la densità spettrale di potenza. Se ho capito bene, quest'ultimo funziona in modo tale da dividere il mio segnale in parti, fare FFT parte per parte e in qualche modo sommarle. Le funzioni della finestra sono in qualche modo coinvolte. Puoi chiarire un po 'questo per me? Sono nuovo di DSP.


1
Suddividere il segnale in segmenti, trovare lo spettro di ciascuno e quindi fare la media degli spettri può aiutare a ridurre il rumore, ma riduce anche la risoluzione. vedi en.wikipedia.org/wiki/Welch%27s_method
endolith

Risposte:


8

Ora, vorrei mostrare quali frequenze ha il discorso. Tuttavia, non sono sicuro di quale sarebbe il modo migliore per farlo. A volte sembra che si calcoli il valore assoluto di una trasformata di Fourier e talvolta la densità spettrale di potenza.

Se si desidera associare un significato fisico all'analisi, utilizzare la densità spettrale di potenza (PSD). Questo perché ti darà semplicemente la potenza del tuo segnale, in ogni banda di frequenza. D'altra parte se non vuoi / ti preoccupi di un significato fisico, ma vuoi sapere come le ampiezze di Fourier di ciascuna banda variano l'una rispetto all'altra, puoi rimanere fedele alla grandezza assoluta.

X[n]X(f)|X(f)||X(f)|2

Se ho capito bene, quest'ultimo funziona in modo tale da dividere il mio segnale in parti, fare FFT parte per parte e in qualche modo sommarle. Le funzioni della finestra sono in qualche modo coinvolte. Puoi chiarire un po 'questo per me? Sono nuovo di DSP.

No, questo non è vero. Quello di cui stai parlando qui si riferisce alla Trasformata di Fourier di Short Time (STFT). Questo è semplicemente tagliare il segnale del dominio del tempo, rimandarlo a una vedova e quindi prendere la trnasform di Fourier. Alla fine della giornata, avrai comunque una matrice complessa. Se scegli di assumere la sua magnitudine assoluta, avrai una matrice di trasformata di Fourier di magnitudine assoluta. Se prendi la sua magnitudine assoluta al quadrato, avrai una matrice di densità spettrale di potenza.


3

La cosa importante da capire su qualcosa come un segnale vocale è che i suoi componenti di frequenza variano nel tempo . Per rappresentare il parlato nel dominio della frequenza di solito prendiamo una finestra abbastanza breve del segnale all'interno della quale possiamo supporre che lo spettro del discorso non vari in modo significativo (in genere 10 ms). Quindi calcoliamo lo spettro di potenza per ogni successiva finestra di 10 ms usando lo STFT (spesso con qualche sovrapposizione tra le finestre) e trattiamo ogni spettro successivo come una "istantanea" delle componenti di frequenza del discorso in quel particolare momento. Spesso gli spettri successivi sono tracciati in un diagramma 3D come uno spettrogramma, con il tempo sull'asse X, la frequenza sull'asse Y e la magnitudine tracciati come falsi colori o intensità della scala dei grigi in ciascuna posizione X, Y.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.