Varie descrizioni sulla selezione del modello sugli effetti casuali dei Modelli misti lineari indicano l'uso del REML. Conosco la differenza tra REML e ML ad un certo livello, ma non capisco perché REML debba essere usato perché ML è di parte. Ad esempio, è sbagliato condurre un LRT su un parametro di varianza di un modello di distribuzione normale usando ML (vedere il codice seguente)? Non capisco perché sia più importante essere imparziali che essere ML, nella selezione del modello. Penso che la risposta definitiva debba essere "perché la selezione del modello funziona meglio con REML che con ML", ma vorrei sapere un po 'di più. Non ho letto le derivazioni di LRT e AIC (non sono abbastanza bravo da capirle a fondo), ma se REML è esplicitamente usato nelle derivazioni, sapendo che sarà effettivamente sufficiente (ad es.
n <- 100
a <- 10
b <- 1
alpha <- 5
beta <- 1
x <- runif(n,0,10)
y <- rnorm(n,a+b*x,alpha+beta*x)
loglik1 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
-sum(dnorm(y,a+b*x,alpha,log=T))
}
loglik2 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
beta <- p[4]
-sum(dnorm(y,a+b*x,alpha+beta*x,log=T))
}
m1 <- optim(c(a,b,alpha),loglik1,x=x,y=y)$value
m2 <- optim(c(a,b,alpha,beta),loglik2,x=x,y=y)$value
D <- 2*(m1-m2)
1-pchisq(D,df=1) # p-value