Quale statistica viene utilizzata per determinare la presenza di un segnale nel rumore?


12

Questo è un problema rilevatore credo:

Sono sconcertato da quello che sembra essere un semplice problema. Fondamentalmente, ho una banda di interesse. Se all'interno di questa banda di interesse esistono energie di segnale, allora eseguo l'operazione X sul mio segnale.

Il mio problema è che non sono sicuro di come fare per "decidere" se esiste o meno un segnale. In quello, dopo che eseguo una FFT, posso cercare picchi.

Ma adesso cosa?

  • La statistica utilizzata viene di solito confrontando questo picco con la media circostante dello spettro? O è qualche altra statistica?
  • Quale misura statistica devo usare per determinare semplicemente se un segnale è presente e passare da lì?
  • Come posso impostare questo valore? Soglia semplice?

EDIT Basato sul feedback:

Per questo semplice caso, sto assumendo un tono, con un rumore gaussiano bianco. Quello che sto cercando di capire sono:

  1. Come si genera esattamente una curva ROC . Bisogna andare prima a etichettare tutti i dati e quindi ottenere i tassi di vero positivo e falso positivo per una moltitudine di soglie?

  2. In che modo la riduzione del SNR influisce sulla curva ROC? Spostarlo verso la diagonale?

  3. Che cosa sta facendo lo shesholding adattivo a una determinata curva ROC che è stata altrimenti generata senza una soglia adattativa?

    3a. Quali sono alcune comuni tecniche di soglia adattativa che posso osservare che sono comuni?


Vuoi un algoritmo batch (offline) o sequenziale (online)? Hai statistiche di rumore e segnale (cioè puoi caratterizzare il rapporto di verosimiglianza)? In tal caso, hai provato a utilizzare un SPRT ?
Emre,

@Emre Può essere offline. Non sono proprio sicuro di cosa si intenda per statistica segnale / rumore, ho un sensore che misurerà un segnale (tono) in presenza di rumore, e il suo SNR può variare ...
Spacey,

Vuol dire: quali sono le proprietà statistiche del rumore e del segnale? Conosci la distribuzione del rumore? E la distribuzione del segnale più il rumore?
Jason R,

@JasonR Capisco. Bene, il segnale sarà un tono e il rumore è gaussiano. Mi sto perdendo qualcosa?
Spacey,

Può essere. Gaussiano bianco? Il punto è che per analizzarlo teoricamente, è necessario assumere un modello di probabilità per il rumore e il segnale più il rumore. Sulla base di quella risposta, puoi farlo.
Jason R,

Risposte:


9

Questo è uno dei più vecchi problemi di elaborazione del segnale, e una forma semplice potrebbe essere incontrata in un'introduzione alla teoria del rilevamento. Esistono approcci teorici e pratici per risolvere tale problema, che possono o meno sovrapporsi a seconda dell'applicazione specifica.

Pd Pfa

PdPfaPd=1Pfa=0e chiamalo un giorno. Come ci si potrebbe aspettare, non è così facile. C'è un compromesso intrinseco tra le due metriche; in genere se fai qualcosa che migliora l'una, osserverai un certo degrado nell'altra.

Un semplice esempio: se stai cercando la presenza di un impulso su uno sfondo di rumore, potresti decidere di impostare una soglia da qualche parte al di sopra del livello di rumore "tipico" e decidere di indicare la presenza del segnale di interesse se la tua statistica di rilevazione si rompe sopra la soglia. Vuoi una probabilità di falso allarme davvero bassa? Imposta la soglia alta. Ma poi, la probabilità di rilevazione potrebbe diminuire significativamente se la soglia elevata è pari o superiore al livello di potenza del segnale previsto!

PdPfa

inserisci qui la descrizione dell'immagine

Un rivelatore ideale avrebbe una curva ROC che abbraccia la parte superiore della trama; cioè, potrebbe fornire un rilevamento garantito per qualsiasi tasso di falsi allarmi. In realtà, un rivelatore avrà una caratteristica che assomiglia a quelle tracciate sopra; aumentando la probabilità di rilevazione aumenterà anche la percentuale di falsi allarmi e viceversa.

Da un punto di vista teorico, quindi, questi tipi di problemi si riducono alla selezione di un certo equilibrio tra prestazioni di rilevamento e probabilità di falsi allarmi. Il modo in cui tale equilibrio viene descritto matematicamente dipende dal modello statistico per il processo casuale che il rivelatore osserva. Il modello avrà in genere due stati o ipotesi:

H0:no signal is present
H1:signal is present

Tipicamente, la statistica osservata dal rivelatore avrebbe una delle due distribuzioni, secondo cui l'ipotesi è vera. Il rivelatore applica quindi una sorta di test che viene utilizzato per determinare la vera ipotesi e quindi se il segnale è presente o meno. Le distribuzioni della statistica di rilevazione sono una funzione del modello di segnale che si sceglie come appropriato per la propria applicazione.

I modelli di segnale comuni sono il rilevamento di un segnale modulato in ampiezza di impulso su uno sfondo di rumore gaussiano bianco additivo (AWGN) . Mentre quella descrizione è in qualche modo specifica per le comunicazioni digitali, molti problemi possono essere associati a quello o ad un modello simile. In particolare, se stai cercando un tono a valore costante localizzato nel tempo su uno sfondo di AWGN, e il rivelatore osserva l'intensità del segnale, quella statistica avrà una distribuzione di Rayleigh se non è presente alcun tono e una distribuzione di Rician se presente.

Una volta sviluppato un modello statistico, è necessario specificare la regola di decisione del rivelatore. Questo può essere complicato quanto desideri, in base a ciò che ha senso per la tua applicazione. Idealmente, si vorrebbe prendere una decisione ottimale in un certo senso, in base alla conoscenza della distribuzione della statistica di rilevazione in entrambe le ipotesi, la probabilità che ciascuna ipotesi sia vera e il costo relativo di sbagliare su entrambe le ipotesi ( di cui parlerò più tra poco). La teoria delle decisioni bayesiane può essere utilizzata come quadro per affrontare questo aspetto del problema da una prospettiva teorica.

TT(t)t

TT=5Pd=0.9999Pfa=0.01

Il punto in cui decidi di sederti sulla curva delle prestazioni dipende da te ed è un parametro di progettazione importante. Il giusto punto di prestazione da scegliere dipende dal costo relativo dei due tipi di possibili guasti: è peggio per il tuo rivelatore perdere un'occorrenza del segnale quando si verifica o registrare un'occorrenza del segnale quando non si è verificato? Un esempio: un fittizio balistico-missile-rivelatore-con-automatico-capacità di risposta sarebbe meglio servito per avere un tasso di allarme molto falso; iniziare una guerra mondiale a causa di una rilevazione spuria sarebbe sfortunato. Un esempio della situazione opposta sarebbe un ricevitore di comunicazione utilizzato per applicazioni di sicurezza della vita; se vuoi avere la massima sicurezza che non riesca a ricevere messaggi di soccorso,


Grazie JasonR, post molto bello. Sto ancora digerendo il tuo post, tuttavia mi viene in mente una domanda. Come viene generata esattamente questa curva ROC? Comprendo che misuro il tasso di vero positivo e falso positivo per qualsiasi classificatore e che segna un punto nella curva ROC. Quindi cosa viene cambiato in modo tale da ottenere molti punti in modo da poter generare una curva per ogni classificatore?
Spacey,

1
PdPfa

1

La statistica è il rapporto di verosimiglianza (LR) e il test è il confronto tra LR e una soglia. Se si segue la tradizione di mettere la probabilità che l'ipotesi nulla al denominatore, si decide a favore della alternativa ipotesi ( contro l' ipotesi nulla ) se la LR è sufficientemente alta. Più alto è il rapporto, maggiore è la tua sicurezza. Questo è il test che eseguiresti se avessi già raccolto i dati. Se si desidera decidere quando i dati arrivano a pasto, è possibile utilizzare un test sequenziale , come SPRT .

A questo punto potresti trarre vantaggio da un libro sui test di ipotesi o sulla teoria delle decisioni (più generale).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.