Deviazione standard della planarità spettrale - quindi cosa sto misurando, concettualmente?


8

Nella mia incessante ricerca per identificare i russamenti, ho scoperto che la "planarità spettrale" sembra essere una misura giusta della "qualità" del segnale.

Sto calcolando la planarità spettrale come media geometrica dei punti dati della potenza FFT divisa per la media aritmetica degli stessi punti.(R2+I2)

Quindi (un po 'di torsione qui) sto calcolando la media aritmetica corrente (oltre 50 fotogrammi) e la deviazione standard della planarità spettrale e calcolando una deviazione standard "normalizzata" come deviazione standard corrente divisa per la media corrente.

Per i miei campioni trovo che questa metrica sia maggiore di circa (che va fino a o giù di lì) quando l'audio è "buono" (cioè, ho un tracciamento affidabile dei suoni respiratori / russanti di un soggetto che dorme) e generalmente scivola giù sotto quando l'audio è "nel fango". (Posso migliorare questa discriminazione in qualche modo usando una soglia che si muove con altri fattori, ma questo è presumibilmente un argomento diverso.) Osservo anche che la misura supera quando c'è un rumore di fondo sostanziale (ad esempio, qualcuno entra nella stanza e fruscia in giro ).0.20.50.21.0

Quindi, la mia domanda di base è: esiste un nome (oltre alla "deviazione standard normalizzata della planarità spettrale") per ciò che sto misurando e qualcuno può offrire una spiegazione concettuale di cosa significhi "metrica"?

(Ho provato una dozzina di altre metriche per la "qualità" del segnale, e questa sembra essere la migliore fino ad oggi.)

Aggiunto: probabilmente dovrei ammettere che non ho una gestione concettuale particolarmente buona su ciò che la semplice planarità spettrale sta misurando (solo l' articolo di Wikipedia ), quindi qualsiasi ulteriore spiegazione di ciò sarebbe apprezzata.


2
Quindi fai un calcolo e ti stai chiedendo se qualcun altro ha avuto la stessa idea e l'ha nominata, e in caso contrario, qualcuno può trovare una spiegazione concettuale di ciò che hai ideato? Sicuramente si deve aver avuto qualche motivazione per mettere nel vostro "piccolo twist", oppure si erano, come Indiana Jones, basta che lo compongono, come si è andato avanti?
Dilip Sarwate,

3
Fondamentalmente sto solo inventando le cose mentre procedo. Trovo una tecnica, la applico ai dati, osservo il risultato e decido se sembra utile. In tal caso, provo i perfezionamenti. È un processo noioso, ma l'esperto di analisi audio che lavora su questo progetto ha rotto la sua scelta e se ne è andato a casa.
Daniel R Hicks,

Risposte:


4

Dato che sei interessato alla "planarità" del tuo spettro, infatti, sei interessato a quanto è vicino il tuo segnale a un rumore bianco (che per definizione ha uno spettro piatto + fasi casuali). Se fai un passo indietro, una misura sarebbe la "distanza" della tua osservazione rispetto al riferimento del rumore bianco .

L'ovvia misura in termini di teoria dell'informazione è la divergenza di Kullback-Leibler . Non è necessario comprenderne ogni parte, ma misura in bit (se si utilizza la base di registro 2) la distanza tra le due distribuzioni.

La cosa buona nel tuo caso è che il tuo riferimento è piatto, in modo che ciò che rimane sia l' entropia del tuo spettro . Esistono molte implementazioni esistenti (ad esempio in scipy ).

Nota che sei ancora al sicuro: se la tua distribuzione è approssimativamente gaussiana, entrambe le misure (entropia e std) saranno proporzionali. L'entropia è tuttavia più generale e di principio. Come estensione, sarai in grado di generalizzare ad altri tipi di rumori (1 / f per esempio).


La cosa strana è che l'entropia "regolare" - somma di p log p- non sembra trasmettere molte informazioni per il mio problema. (Anche se suppongo di non aver provato a prendere la deviazione standard.)
Daniel R Hicks il

3

Qualsiasi differenza consistente e affidabile nelle statistiche del tuo segnale (o in qualche funzione del tuo segnale, come il suo spettro) e il rumore in cui è incorporato il tuo segnale può essere usata per stimare una probabilità dell'una rispetto all'altra.

Sembra che tu abbia trovato casualmente (inciampato) uno di un numero probabilmente infinito di modi per caratterizzare la forma dello spettro del segnale che differenzia il segnale desiderato da cose più simili al rumore bianco o ai picchi di impulso. Inciampare su una possibile soluzione casuale muore non invalidarla (questa è una base della programmazione evolutiva / genetica). Ma quanto è solida una misura che hai trovato è un esercizio sperimentale.


Il fatto è che altre misure, come l'entropia regolare, non hanno mostrato la stessa promessa di questa misura. Se potessi capire perché questo sembra migliore, potrei forse migliorarlo.
Daniel R Hicks,

hotpaw2, Lei menziona alcuni altri modi in cui si può distinguere tra segnale e rumore - o qualche 'misura' della forma di uno spettro di magnitudo FFT - quali modi ci sono esattamente che vengono in mente?
Spacey,

Mi viene in mente esattamente ??? A volte si dice che gli algoritmi di ricerca di tipo evolutivo / genetico / di Hadoop estraggono roba, a partire da dati sufficienti, di "forme" che non vengono in mente né di solito descritte come esatte, fino a forse dopo il fatto.
hotpaw2,

@ hotpaw2 Mi dispiace, forse la mia domanda non era chiara: mi stavo solo chiedendo quali modi semplici di misurare, diciamo, potrebbe esistere il "picco" (come esempio di come potrebbe apparire uno spettro). Non chiedevo nulla di troppo elegante, anche se quei metodi di apprendimento senza supervisione che hai citato sono certamente potenti.
Spacey,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.