Utilizzo dei decibel nelle statistiche


11

Sto lavorando a un progetto che prevede la lettura di tag RFID e il confronto dell'intensità del segnale che il lettore vede quando si modifica la configurazione dell'antenna (numero di antenna, posizione, ecc ...). Come parte del progetto, devo confrontare le configurazioni per vedere quali sono più efficaci.

Idealmente, sarei in grado di eseguire un T-Test spaiato o un ANOVA tra due posizioni dell'antenna (o MANOVA tra più). Tuttavia, poiché la risposta è in decibel che sono logaritmici, mi chiedo quale sia il modo migliore di procedere?

Sarebbe meglio convertire i risultati in una scala lineare e poi confrontarli usando uno dei metodi che ho citato, o dovrei usare i decibel così come sono con un diverso test statistico per confrontarli?


2
Preso la libertà di modificare i tag. Le statistiche matematiche sono in pratica un tag inutile. Le serie logaritmiche si riferiscono a qualcosa di completamente diverso con una risposta discreta.
Nick Cox,

1
Dato che si stanno utilizzando i test assumendo una distribuzione gaussiana, se la distribuzione delle risposte è "più gaussiana" in dB rispetto alla scala lineare (ovvero i dati originali sono approssimativamente log normali), ha senso rimanere nella scala logaritmica.
Luca Citi,

@NickCox, penso che funzioni mathematical-statisticsbene quando si richiede una prova, il tag corrispondente è sinonimo del tag precedente.
Richard Hardy,

Forse avrei dovuto dire "un tag inutile per questo tipo di domanda".
Nick Cox,

Risposte:


5

La trasformazione dipende da quale scala desideri dedurre.

Generalmente, la varianza di una funzione di non è uguale alla funzione della varianza di . Perché trasformando con , quindi eseguendo inferenza statistica (test di ipotesi o intervalli di confidenza) su , quindi la trasformazione a ritroso - - i risultati di tale inferenza da applicare a non sono validi (poiché sia ​​le statistiche dei test che gli EC richiedono una stima della varianza).XXσf(X)2f(σX2)Xff(X)f-1X

Basare gli EC su variabili trasformate + back-Transform produce intervalli senza le probabilità di copertura nominali, quindi la fiducia back-Transform su una stima basata su non è la fiducia su una stima basata su .f(X)X

Allo stesso modo, inferenze su variabili non trasformate basate su test di ipotesi su variabili trasformate significa che una delle seguenti condizioni può essere vera, ad esempio, quando si fanno inferenze su base a una variabile di raggruppamento :Xy

  1. X differisce significativamente tra , ma non differisce significativamente tra .yf(X)y

  2. X differisce significativamente tra e differisce significativamente tra .yf(X)y

  3. X non differisce significativamente tra e non differisce significativamente tra .yf(X)y

  4. X non differisce significativamente tra , ma differisce significativamente tra .yf(X)y

In breve, sapere se differisce significativamente tra i gruppi di non ti dice se differisce tra .f(X)yXy

Quindi la domanda se trasformare quei dB è una risposta se ti interessa dB o esponenziale dB.


14

Dobbiamo assolutamente vedere i tuoi dati per avere qualche possibilità di dare una consulenza definitiva, ma è possibile indovinare.

Come dici tu, i decibel sono già su scala logaritmica. Ciò probabilmente significherà, per una varietà di ragioni fisiche e statistiche, che è abbastanza probabile che si comportino bene essendo approssimativamente additivi, omoscedastici e distribuiti simmetricamente ai predittori. Ma potresti essere in grado di fornire una discussione fisica o ingegneristica su come la risposta dovrebbe variare mentre modifichi le variabili di progettazione.

Non conosco alcun principio o teoria possibile che significhi che sei obbligato a esponenziarli prima di applicare un test o ANOVA. Mi aspetterei che peggiorasse il comportamento statistico, non meglio.t

Lo stesso tipo di ragionamento si applica di solito ad altre scale logaritmiche "pre-trasformate" come il pH o la scala Richter.

PS: Non ho idea di cosa siano i tag RFID.


4
I tag RFID sono tag ID a radiofrequenza ... elementi del passaporto, materiale di biblioteca, carta di credito scheggiata, ecc. Che rendono possibile l'ID basato su token in modalità wireless.
Alexis,

2
Downvote che sembra casuale lì dentro. Non ho molte ragioni per lamentarmi perché ho diversi voti per poco lavoro e non è un'ottima risposta. (Avrei potuto scriverne una migliore vista di alcuni dati.) Ma il downvote è inutile: senza una ragione data non c'è spazio per cambiare idea a nessuno!
Nick Cox,

3
Infatti, NO? Vorrei davvero che gli elettori negativi avrebbero lasciato un feedback costruttivo.
Alexis

3

Bene, l'unico modo per rispondere definitivamente a questa domanda è quello di esaminare alcuni dati di decibel: esiste una distribuzione semplice (ad esempio la distribuzione gaussiana) che è un buon modello per questo? O l'esponenziale dei dati è un candidato migliore? La mia ipotesi è che i dati non esponenziali siano più quasi gaussiani e quindi per rendere più semplice qualsiasi analisi che ne consegue, dovresti usarlo, ma ti lascerò giudicare.

Metto in dubbio la tua proposta di analisi, che consiste nell'applicare un test di significatività ai dati osservati da diversi esperimenti (in particolare diverse posizioni dell'antenna). Dal considerare la fisica di questo, ci deve essere qualche differenza, forse minuscola, forse sostanziale. Ma a priori c'è qualche differenza, quindi con un set di dati abbastanza grande, è necessario rifiutare l'ipotesi nulla di nessuna differenza. Pertanto, l'effetto di un test di significatività è solo quello di concludere "hai / non hai un set di dati di grandi dimensioni". Non sembra molto utile.

Più utile sarebbe quantificare la differenza tra le diverse posizioni dell'antenna e forse prendere in considerazione anche costi e benefici per decidere quale posizione deve essere selezionata. Le differenze quantificate sono talvolta chiamate "analisi della dimensione dell'effetto"; una ricerca web per questo dovrebbe rivelare alcune risorse. Costi e benefici rientrano nel campo della teoria dell'utilità e della teoria delle decisioni; ancora una ricerca troverà alcune risorse.


2

La scala (logaritmica) di Decibel è utile perché la potenza di un segnale può spesso essere descritta da una serie (variabile) (o intervallo di fluidi) di moltiplicazioni.

  • 110
  • 1100
  • 11000
  • eccetera.

P[mW]=P0(110)L[cm]

Questo è più semplice, se si esprime il logaritmo della potenza del segnale, come una funzione lineare (che, se lo si desidera, richiede una definizione della scala assoluta, in questo caso 0 dB si riferisce a 1 mW)

P[dB]=10(log(P0[mW])-L[cm])

Ogni volta che hai un processo moltiplicativo come:

XαeY

Y

Y~N(μ,σ2)

Xlog(X)


Mi aspetto che il tuo termine di errore sarà così moltiplicativo . Che è: la potenza del segnale sarà una somma di molti termini normali errore distribuito (p.es. amplificatore variazioni di temperatura, condizioni atmosferiche, etc.) che si verificano nel esponente della espressione per la potenza del segnale.

yio=eXio+εio
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.