È possibile utilizzare un test t per valutare se ci sono differenze nei mezzi. Le diverse dimensioni del campione non causano problemi per il test t e non richiedono che i risultati vengano interpretati con particolare attenzione. In definitiva, puoi persino confrontare una singola osservazione con una popolazione infinita con una distribuzione, una media e una SD note; per esempio, qualcuno con un QI di 130 è più intelligente del 97,7% delle persone. Una cosa da notare, tuttavia, è che per una data (cioè, la dimensione totale del campione), la potenza viene massimizzata se il gruppo è uguale; con dimensioni di gruppo molto diverse, non si ottiene una risoluzione aggiuntiva con ogni osservazione aggiuntiva. nNn
Per chiarire il mio punto sul potere, ecco una simulazione molto semplice scritta per R:
set.seed(9) # this makes the simulation exactly reproducible
power5050 = vector(length=10000) # these will store the p-values from each
power7525 = vector(length=10000) # simulated test to keep track of how many
power9010 = vector(length=10000) # are 'significant'
for(i in 1:10000){ # I run the following procedure 10k times
n1a = rnorm(50, mean=0, sd=1) # I'm drawing 2 samples of size 50 from 2 normal
n2a = rnorm(50, mean=.5, sd=1) # distributions w/ dif means, but equal SDs
n1b = rnorm(75, mean=0, sd=1) # this version has group sizes of 75 & 25
n2b = rnorm(25, mean=.5, sd=1)
n1c = rnorm(90, mean=0, sd=1) # this one has 90 & 10
n2c = rnorm(10, mean=.5, sd=1)
power5050[i] = t.test(n1a, n2a, var.equal=T)$p.value # here t-tests are run &
power7525[i] = t.test(n1b, n2b, var.equal=T)$p.value # the p-values are stored
power9010[i] = t.test(n1c, n2c, var.equal=T)$p.value # for each version
}
mean(power5050<.05) # this code counts how many of the p-values for
[1] 0.7019 # each of the versions are less than .05 &
mean(power7525<.05) # divides the number by 10k to compute the %
[1] 0.5648 # of times the results were 'significant'. That
mean(power9010<.05) # gives an estimate of the power
[1] 0.3261
Si noti che in tutti i casi , ma che nel primo caso & , nel secondo caso & e nell'ultimo caso e . Si noti inoltre che la differenza media standardizzata / processo di generazione dei dati è stato lo stesso in tutti i casi. Tuttavia, mentre il test era "significativo" il 70% delle volte per il campione 50-50, la potenza era del 56% con 75-25 e solo del 33% quando le dimensioni del gruppo erano 90-10. n 1 = 50 n 2 = 50 n 1 = 75 n 2 = 25 n 1 = 90 n 2 = 10N=100n1=50n2=50n1=75n2=25n1=90n2=10
Ci penso per analogia. Se vuoi conoscere l'area di un rettangolo e il perimetro è fisso, l'area verrà ingrandita se la lunghezza e la larghezza sono uguali (cioè se il rettangolo è un quadrato ). D'altra parte, quando la lunghezza e la larghezza divergono (man mano che il rettangolo si allunga), l'area si restringe.