Al primo livello, penso che tutti voi stiate ignorando il restringimento verso i valori della popolazione; " le pendenze e le intercettazioni per soggetto dal modello a effetti misti sono più vicine alle stime della popolazione rispetto alle stime dei minimi quadrati all'interno del soggetto. " [rif. 1]. Il seguente link probabilmente sarà anche di aiuto ( Quali sono i descrittori adeguati per cercare i miei modelli misti? ), Vedi la risposta di Mike Lawrence).
Inoltre, penso che tu sia leggermente sfortunato nell'esempio del tuo giocattolo perché hai un design perfettamente bilanciato che ti fa avere la stessa stima esatta nel caso in cui non ci siano valori mancanti.
Prova il seguente codice che ha lo stesso processo senza valore mancante ora:
cat <- as.factor(sample(1:5, n*k, replace=T) ) #This should be a bit unbalanced.
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits= 7,fixef(m3)) == round(digits=7, coef(m1)) #Not this time lad.
#(Intercept) x
# FALSE FALSE
Dove ora, poiché il tuo design non è perfettamente bilanciato, non hai le stesse stime dei coefficienti.
In realtà se giochi con il tuo modello di valore mancante in modo sciocco (quindi per esempio:) y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
quindi il tuo design è ancora perfettamente bilanciato otterrai di nuovo gli stessi coefficienti.
require(nlme)
set.seed(128)
n <- 100
k <- 5
cat <- as.factor(rep(1:k, each = n))
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
plot(x, y)
# simulate missing data in a perfectly balanced way
y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits=7,fixef(m3)) == round(digits=7, coef(m1)) #Look what happend now...
#(Intercept) x
# TRUE TRUE
Sei leggermente fuorviato dal design perfetto del tuo esperimento originale. Quando hai inserito le NA in una distanza non bilanciata, hai cambiato il modello di quanta "forza" i singoli soggetti potevano prendere in prestito l'uno dall'altro.
In breve, le differenze che si vedono sono dovute agli effetti di restringimento e più precisamente perché hai distorto il tuo design originale perfettamente bilanciato con valori mancanti non perfettamente bilanciati.
Rif.1 : Douglas Bates lme4: modellazione di effetti misti con R , pagine 71-72
m3
è 0.0011713" invece dim2
.