Sto cercando di capire il calcolo della potenza per il caso dei due test t del campione indipendenti (non assumendo varianze uguali, quindi ho usato Satterthwaite).
Ecco un diagramma che ho trovato per aiutare a capire il processo:

Quindi ho ipotizzato che dato quanto segue sulle due popolazioni e date le dimensioni del campione:
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
Potrei calcolare il valore critico sotto il null relativo ad avere 0,05 probabilità di coda superiore:
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df) #equals 1.730018
e quindi calcolare l'ipotesi alternativa (che per questo caso ho imparato è una "distribuzione t non centrale"). Ho calcolato la beta nel diagramma sopra usando la distribuzione non centrale e il valore critico trovato sopra. Ecco lo script completo in R:
#under alternative
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
#Under null
Sp<-sqrt(((n1-1)*sd1^2+(n2-1)*sd2^2)/(n1+n2-2))
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df)
#under alternative
diff<-mu1-mu2
t<-(diff)/sqrt((sd1^2/n1)+ (sd2^2/n2))
ncp<-(diff/sqrt((sd1^2/n1)+(sd2^2/n2)))
#power
1-pt(t, df, ncp)
Questo dà un valore di potenza di 0,4935132.
È questo l'approccio corretto? Trovo che se uso altri software di calcolo della potenza (come SAS, che penso di aver impostato in modo equivalente al mio problema di seguito) ottengo un'altra risposta (da SAS è 0,33).
CODICE SAS:
proc power;
twosamplemeans test=diff_satt
meandiff = 1
groupstddevs = 3 | 2
groupweights = (1 1)
ntotal = 40
power = .
sides=1;
run;
In definitiva, vorrei ottenere una comprensione che mi permettesse di esaminare le simulazioni per procedure più complicate.
EDIT: ho trovato il mio errore. avrebbe dovuto essere
1-pt (CV, df, ncp) NON 1-pt (t, df, ncp)
