Quali ipotesi di normalità sono richieste per un t-test spaiato? E quando si incontrano?

12

Se desideriamo condurre un test t accoppiato, il requisito è (se ho capito bene) che la differenza media tra le unità di misura abbinate sarà distribuita normalmente.

Nel test t accoppiato, questo è articolato (AFAIK) nella richiesta che la differenza tra le unità di misura abbinate sarà distribuita normalmente (anche se la distribuzione di ciascuno dei due gruppi confrontati non è normale).

Tuttavia, in un test t non accoppiato, non possiamo parlare della differenza tra unità abbinate, quindi richiediamo che le osservazioni dei due gruppi siano normali in modo che la differenza della loro media sia normale. Il che mi porta alla mia domanda:

È possibile per due distribuzioni non normali in modo che la differenza dei loro mezzi sia distribuita normalmente? (e quindi, soddisfare i nostri requisiti necessari per eseguire un test t spaiato su di loro - ancora una volta - per quanto ho capito).

Aggiornamento: (grazie a tutti per le risposte) Vedo che la regola generale che stiamo cercando è davvero che la differenza dei mezzi sarà normale, il che sembra essere un buon presupposto (sotto n abbastanza grande) a causa del CLT. Questo è sorprendente per me (non sorprendente, semplicemente fantastico), per quanto riguarda come funziona per il t-test spaiato, ma non funzionerà altrettanto bene per il test t singolo campione. Ecco un po 'di codice R per illustrare:

n1 <- 10
n2 <- 10
mean1 <- 50
mean2 <- 50
R <- 10000

# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
# hist(diffs)

P <- numeric(R)
MEAN <- numeric(R)
for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    y2 <- runif(n2, 0, 2*mean2)
    MEAN[i] <- mean(y1) - mean(y2)
    P[i] <- t.test(y1,y2)$p.value
}
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
par(mfrow = c(1,2))
hist(P)
qqplot(P, runif(R)); abline(0,1)
sum(P<.05) / R # for n1=n2=10 -> 0.0715 # wrong type I error, but only for small n1 and n2 (for larger ones, this effect disappears)



n1 <- 100
mean1 <- 50
R <- 10000
P_y1 <- numeric(R)

for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}

par(mfrow = c(1,2))
hist(P_y1)
qqplot(P_y1, runif(R)); abline(0,1)
sum(P_y1<.05) / R # for n1=n2=10 -> 0.057  # "wrong" type I error

Grazie.

t-test normality-assumption assumptions

— Tal Galili
fonte

5

Certo . Sia tuo campione bivariato. Lascia che abbia una distribuzione arbitraria e prendi dove sono iid .

(X_{i}, Y_{i})

$(X_i,Y_i)$

X_{i}

$X_i$

F

$F$

Y_{i} = X_{i} + Z_{i}

$Y_i = X_i + Z_i$

{Z_{i}}

$\{Z_i\}$

N (0, σ^{2})

$\mathcal{N}(0,\sigma^2)$

— cardinale l'

17

In pratica, il Teorema del limite centrale ci assicura che, sotto una vasta gamma di ipotesi, le distribuzioni dei due mezzi campione testati si avvicineranno alle distribuzioni normali man mano che le dimensioni del campione aumentano, indipendentemente (qui è dove arrivano le ipotesi) di le distribuzioni dei dati sottostanti. Di conseguenza, quando la dimensione del campione aumenta, la differenza dei mezzi viene normalmente distribuita e i requisiti necessari per la statistica t di un test t spaiato per far sì che la distribuzione t nominale sia soddisfatta. Pertanto, potrebbe essere una domanda più pratica, quanto deve essere grande la dimensione del campione prima che io possa ignorare in modo sicuro la differenza tra la distribuzione effettiva della statistica e la distribuzione t?

In molti casi, la risposta è "non molto grande", specialmente quando le distribuzioni sottostanti sono abbastanza simili a simmetriche. Ad esempio, ho simulato 100.000 test confrontando le medie di due distribuzioni Uniform (0,1), ciascuna con una dimensione del campione 10 e, durante i test con un livello di confidenza del 95%, in realtà ho rifiutato il null 5,19% delle volte - quasi diverso dal tasso di rifiuto nominale del 5% che speriamo (sebbene sia circa 2,7 deviazioni standard sopra il 5%).

Questo è il motivo per cui le persone usano il test t in tutti i tipi di situazioni in cui le ipotesi sottostanti non sono effettivamente soddisfatte, ma ovviamente il tuo chilometraggio può variare, a seconda delle specifiche del tuo problema. Tuttavia, ci sono altri test che non richiedono la normalità, come il test di Wilcoxon, che, anche quando i dati sono normalmente distribuiti, è asintoticamente circa il 95% efficiente quanto il test t (cioè richiede una dimensione del campione di N / 0,95 per avere la stessa potenza di un test t con una dimensione del campione di N, poiché N va all'infinito). Quando i dati non sono normalmente distribuiti, possono essere (non necessariamente saranno) molto migliori del test t.

— jbowman
fonte

6

Nella mia esperienza, la dimensione del campione richiesta affinché la distribuzione sia accurata è spesso maggiore della dimensione del campione a portata di mano. Il test dei ranghi firmati Wilcoxon è estremamente efficiente, come hai detto, ed è robusto, quindi quasi sempre lo preferisco al test .

t

$t$

t

$t$

— Frank Harrell,

Grazie Frank - il tuo commento mi ha aiutato a formulare

— Tal Galili

1

Ovviamente. In caso contrario, il test t per campioni indipendenti non sarebbe di grande utilità. Abbiamo davvero bisogno di campioni di dimensioni maggiori, perché per testare una differenza nelle medie tra due popolazioni non normali dobbiamo fare appello al CLT.

Per un rapido esempio, supponiamo di avere una popolazione 1 proveniente da un esponenziale con media 25 e popolazione 2 uniformemente distribuita con media 30. Daremo loro anche diverse dimensioni del campione. Possiamo esaminare come appare la distribuzione delle differenze nel campione usando R usando relativamente facilmente usando la funzione replicate.

n1 <- 30
n2 <- 25
mean1 <- 25
mean2 <- 30

diffs <- replicate(10000, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
hist(diffs)

Giocare con le dimensioni del campione mostrerà che a dimensioni del campione basse non abbiamo davvero la normalità ma aumentando la dimensione del campione ci dà una distribuzione di campionamento dall'aspetto più normale per la differenza nelle medie. Naturalmente è possibile modificare le distribuzioni utilizzate in questo esempio per esplorare ulteriormente. Hist (diff)

— Dason
fonte