Questa è più una domanda concettuale, ma mentre uso R
farò riferimento ai pacchetti in R
. Se l'obiettivo è quello di adattare un modello lineare ai fini della previsione, e quindi fare previsioni in cui gli effetti casuali potrebbero non essere disponibili, ci sono dei vantaggi nell'utilizzare un modello a effetti misti o dovrebbe invece essere usato un modello a effetti fissi?
Ad esempio, se ho dati sul peso vs. altezza con alcune altre informazioni e costruisco il modello seguente usando lme4
, dove soggetto è un fattore con livelli ( ):
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
Quindi voglio essere in grado di prevedere il peso dal modello utilizzando nuovi dati di altezza e età. Ovviamente la varianza per soggetto nei dati originali viene catturata nel modello, ma è possibile utilizzare queste informazioni nella previsione? Diciamo che ho alcuni nuovi dati di altezza e età e voglio prevedere il peso, posso farlo come segue:
predict(mod1,newdata=newdf) # newdf columns for height, age, subject
Questo userà predict.merMod
, e posso includere una colonna per (nuovi) soggetti newdf
o impostare re.form =~0
. Nel primo caso, non è chiaro cosa faccia il modello con i "nuovi" fattori del soggetto, e nel secondo caso, la varianza per soggetto catturata nel modello sarà semplicemente ignorata (mediata) per la previsione?
In entrambi i casi, mi sembra che un modello lineare a effetto fisso potrebbe essere più appropriato. In effetti, se la mia comprensione è corretta, allora un modello a effetto fisso dovrebbe prevedere gli stessi valori del modello misto, se l'effetto casuale non è usato nella previsione. Questo dovrebbe essere il caso? In R
esso non è, ad esempio:
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject
produce risultati diversi per:
mod2 <- lm(weight ~ height + age, data=df)
predict(mod2,newdata=newdf) # newdf columns for height, age