Nella mia incessante ricerca per identificare i russamenti, ho scoperto che la "planarità spettrale" sembra essere una misura giusta della "qualità" del segnale.
Sto calcolando la planarità spettrale come media geometrica dei punti dati della potenza FFT divisa per la media aritmetica degli stessi punti.
Quindi (un po 'di torsione qui) sto calcolando la media aritmetica corrente (oltre 50 fotogrammi) e la deviazione standard della planarità spettrale e calcolando una deviazione standard "normalizzata" come deviazione standard corrente divisa per la media corrente.
Per i miei campioni trovo che questa metrica sia maggiore di circa (che va fino a o giù di lì) quando l'audio è "buono" (cioè, ho un tracciamento affidabile dei suoni respiratori / russanti di un soggetto che dorme) e generalmente scivola giù sotto quando l'audio è "nel fango". (Posso migliorare questa discriminazione in qualche modo usando una soglia che si muove con altri fattori, ma questo è presumibilmente un argomento diverso.) Osservo anche che la misura supera quando c'è un rumore di fondo sostanziale (ad esempio, qualcuno entra nella stanza e fruscia in giro ).
Quindi, la mia domanda di base è: esiste un nome (oltre alla "deviazione standard normalizzata della planarità spettrale") per ciò che sto misurando e qualcuno può offrire una spiegazione concettuale di cosa significhi "metrica"?
(Ho provato una dozzina di altre metriche per la "qualità" del segnale, e questa sembra essere la migliore fino ad oggi.)
Aggiunto: probabilmente dovrei ammettere che non ho una gestione concettuale particolarmente buona su ciò che la semplice planarità spettrale sta misurando (solo l' articolo di Wikipedia ), quindi qualsiasi ulteriore spiegazione di ciò sarebbe apprezzata.