Una trasformazione del registro è una tecnica valida per i test di dati non normali?


19

Nel rivedere un articolo, gli autori affermano che "Le variabili di risultato continue che mostrano una distribuzione distorta sono state trasformate, usando i logaritmi naturali, prima che i test t fossero condotti per soddisfare i presupposti della normalità".

È un modo accettabile di analizzare dati non normali, in particolare se la distribuzione sottostante non è necessariamente lognormale?

Questa potrebbe essere una domanda molto stupida, ma non l'ho mai visto prima ...


3
Bene, se la distribuzione iniziale non è log-normale, allora i dati trasformati non soddisfano i presupposti di normalità prerequisiti, quindi cosa si ottiene dalla trasformazione?
Macro

@Macro - abbastanza vero! (+1) - probabilmente volevano solo avvicinare le distribuzioni a simmetriche, il che non è una brutta cosa da fare per i test t, ma, a meno che non abbiano verificato e scritto, non sappiamo se il registro La trasformazione ha indotto uno
spostamento

2
Potremmo dedurre che, poiché è stato fatto per soddisfare la normalità e la normalità è stata verificata in primo luogo, la normalità è stata successivamente verificata. È fortemente implicito nella lingua qui.
John

10
Un test t per i logaritmi non è lo stesso di un test t per i dati non trasformati né un test non parametrico. Il test t sui registri confronta i mezzi geometrici , non i (soliti) mezzi aritmetici. Questa è una delle diverse considerazioni importanti nel decidere se è accettabile l'uso dei logaritmi (cosa che può essere, a seconda dell'applicazione).
whuber

Risposte:


9

È comune provare ad applicare una sorta di trasformazione alla normalità (usando ad esempio logaritmi, radici quadrate, ...) quando si incontrano dati che non sono normali. Mentre il logaritmo produce ragionevolmente buoni risultati per dati distorti, non vi è alcuna garanzia che funzionerà in questo caso particolare. Si dovrebbe anche tenere presente il commento di @whubers sopra quando si analizzano i dati trasformati: "Un test t per i logaritmi non è lo stesso di un test t per i dati non trasformati né un test non parametrico. Il test t sui registri confronta geometrico significa, non i (soliti) mezzi aritmetici. "

Le trasformazioni in normalità dovrebbero sempre essere seguite da un'indagine sul presupposto della normalità, per valutare se i dati trasformati sembrano "abbastanza normali". Questo può essere fatto usando ad esempio istogrammi, grafici QQ e test per la normalità. Il test t è particolarmente sensibile alle deviazioni dalla normalità sotto forma di asimmetria e quindi sarebbe preferibile un test per la normalità diretto verso alternative oblique. L'asimmetria di Pearson è una statistica di test adatta in questo caso.n-1Σio=1n(Xio-X¯)3(n-1Σio=1n(Xio-X¯)2)3/2

Piuttosto che scegliere una trasformazione (come i logaritmi) perché funziona il più delle volte, preferisco usare la procedura Box-Cox per scegliere una trasformazione usando i dati forniti. Vi sono tuttavia alcuni problemi filosofici con questo; in particolare se ciò dovrebbe influire sul numero di gradi di libertà nel test t, poiché abbiamo usato alcune informazioni dal campione quando abbiamo scelto quale trasformazione usare.

Infine, una buona alternativa all'uso del test t dopo una trasformazione o di un test non parametrico classico consiste nell'utilizzare l' analogo bootstrap del test t. Non richiede l'assunzione della normalità ed è un test sui mezzi non trasformati (e non su qualsiasi altra cosa).


1
+1 Discussione positiva e ponderata con una buona raccomandazione alla fine. Per ulteriori informazioni sulla versione bootstrap / ricampionamento / permutazione del test t, consultare una discussione recente su stats.stackexchange.com/q/24911 .
whuber

0

In generale, se le ipotesi richieste per eseguire un test t non sono soddisfatte, sarebbe più appropriato utilizzare un test non parametrico.


5
Può essere. I test non parametrici confrontano quasi sempre le mediane (o altri percentili) piuttosto che i mezzi e quindi affrontano davvero una domanda leggermente diversa. Ma questa non sembra una risposta utile alla domanda attuale, che chiede specificamente (e solo) il test t dei registri dei dati.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.