Sappiamo che un test t accoppiato è solo un caso speciale di ANOVA a misure ripetute a senso unico (o all'interno del soggetto) e modello lineare a effetto misto, che può essere dimostrato con la funzione lme () il pacchetto nlme in R come mostrato di seguito.
#response data from 10 subjects under two conditions
x1<-rnorm(10)
x2<-1+rnorm(10)
# Now create a dataframe for lme
myDat <- data.frame(c(x1,x2), c(rep("x1", 10), rep("x2", 10)), rep(paste("S", seq(1,10), sep=""), 2))
names(myDat) <- c("y", "x", "subj")
Quando eseguo il seguente test t accoppiato:
t.test(x1, x2, paired = TRUE)
Ho ottenuto questo risultato (otterrai un risultato diverso a causa del generatore casuale):
t = -2.3056, df = 9, p-value = 0.04657
Con l'approccio ANOVA possiamo ottenere lo stesso risultato:
summary(aov(y ~ x + Error(subj/x), myDat))
# the F-value below is just the square of the t-value from paired t-test:
Df F value Pr(>F)
x 1 5.3158 0.04657
Ora posso ottenere lo stesso risultato in lme con il modello seguente, assumendo una matrice di correlazione simmetrica definita positiva per le due condizioni:
summary(fm1 <- lme(y ~ x, random=list(subj=pdSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.3142115 9 -0.7918878 0.4488
# xx2 1.3325786 0.5779727 9 2.3056084 0.0466
O un altro modello, ipotizzando una simmetria composta per la matrice di correlazione delle due condizioni:
summary(fm2 <- lme(y ~ x, random=list(subj=pdCompSymm(form=~x-1)), data=myDat))
# the 2nd row in the following agrees with the paired t-test
# (Intercept) -0.2488202 0.4023431 9 -0.618428 0.5516
# xx2 1.3325786 0.5779727 9 2.305608 0.0466
Con il test t accoppiato e le misure ripetute a senso unico ANOVA, posso scrivere il modello di media cellulare tradizionale come
Yij = μ + αi + βj + εij, i = 1, 2; j = 1, ..., 10
dove i indicizza la condizione, j indica il soggetto, Y ij è la variabile di risposta, μ è costante per l'effetto fisso per la media complessiva, α i è l'effetto fisso per la condizione, β j è l'effetto casuale per il soggetto che segue N (0, σ p 2 ) (σ p 2 è la varianza della popolazione) e ε ij è residuo dopo N (0, σ 2 ) (σ 2 è la varianza all'interno del soggetto).
Ho pensato che il modello di media cellulare sopra non sarebbe appropriato per i modelli di lme, ma il problema è che non riesco a trovare un modello ragionevole per i due approcci di lme () con l'ipotesi della struttura di correlazione. Il motivo è che il modello lme sembra avere più parametri per i componenti casuali rispetto al modello medio di cella sopra offerto. Almeno il modello lme fornisce esattamente lo stesso valore F, gradi di libertà e valore p, che gls non può. Più specificamente gls fornisce DF errati a causa del fatto che non tiene conto del fatto che ogni soggetto ha due osservazioni, portando a DF molto gonfiati. Molto probabilmente il modello lme è sovra parametrizzato nel specificare gli effetti casuali, ma non so quale sia il modello e quali siano i parametri. Quindi il problema è ancora irrisolto per me.