Perché prevedere da un modello di effetti misti senza includere effetti casuali per la previsione?


10

Questa è più una domanda concettuale, ma mentre uso Rfarò riferimento ai pacchetti in R. Se l'obiettivo è quello di adattare un modello lineare ai fini della previsione, e quindi fare previsioni in cui gli effetti casuali potrebbero non essere disponibili, ci sono dei vantaggi nell'utilizzare un modello a effetti misti o dovrebbe invece essere usato un modello a effetti fissi?

Ad esempio, se ho dati sul peso vs. altezza con alcune altre informazioni e costruisco il modello seguente usando lme4, dove soggetto è un fattore con livelli ( ):nn=no.Sun'mpleS

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

Quindi voglio essere in grado di prevedere il peso dal modello utilizzando nuovi dati di altezza e età. Ovviamente la varianza per soggetto nei dati originali viene catturata nel modello, ma è possibile utilizzare queste informazioni nella previsione? Diciamo che ho alcuni nuovi dati di altezza e età e voglio prevedere il peso, posso farlo come segue:

predict(mod1,newdata=newdf) # newdf columns for height, age, subject

Questo userà predict.merMod, e posso includere una colonna per (nuovi) soggetti newdfo impostare re.form =~0. Nel primo caso, non è chiaro cosa faccia il modello con i "nuovi" fattori del soggetto, e nel secondo caso, la varianza per soggetto catturata nel modello sarà semplicemente ignorata (mediata) per la previsione?

In entrambi i casi, mi sembra che un modello lineare a effetto fisso potrebbe essere più appropriato. In effetti, se la mia comprensione è corretta, allora un modello a effetto fisso dovrebbe prevedere gli stessi valori del modello misto, se l'effetto casuale non è usato nella previsione. Questo dovrebbe essere il caso? In Resso non è, ad esempio:

mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)

predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject

produce risultati diversi per:

mod2 <- lm(weight ~ height + age, data=df)

predict(mod2,newdata=newdf) # newdf columns for height, age



1
Potresti voler prevedere un nuovo gruppo che non è stato incluso nella stima
kjetil b halvorsen,

Sì, ma in quel caso perché preoccuparsi di un modello a effetti misti? Cosa ti dà un modello a effetti fissi che no, se ignori gli effetti casuali nella previsione?
tribalsoul,

1
Bene, potrebbe dare stimatori migliori, perché hai un modello migliore (più corretto) della struttura dell'errore
kjetil b halvorsen,

Risposte:


5

Semplice esperimento mentale: hai misurato il peso e l'altezza di 5 bambini dopo la nascita. E l'hai misurato di nuovo dagli stessi bambini dopo due anni. Nel frattempo hai misurato il peso e l'altezza di tua figlia quasi ogni settimana ottenendo 100 coppie di valori per lei. Se usi un modello di effetti misti, non ci sono problemi. Se usi un modello a effetti fissi, attribuisci un peso eccessivo alle misurazioni di tua figlia, al punto da ottenere quasi lo stesso modello se utilizzassi solo i suoi dati. Pertanto, non è importante solo per dedurre correttamente la modellazione di misure ripetute o strutture di incertezza, ma anche per la previsione. In generale, non si ottengono le stesse previsioni da un modello di effetti misti e da un modello di effetti fissi (con ipotesi violate).

e posso includere una colonna per (nuovi) soggetti in newdf

Non è possibile prevedere per soggetti che non facevano parte dei dati (di formazione) originali. Ancora una volta un esperimento mentale: la nuova materia è obesa. Come può il modello sapere che si trova all'estremità superiore della distribuzione casuale degli effetti?

la varianza per soggetto catturata nel modello verrà semplicemente ignorata (mediata) per la previsione

Se ti capisco correttamente, allora sì. Il modello fornisce una stima del valore atteso per la popolazione (si noti che questa stima è ancora subordinata ai soggetti originali).


1
Grazie per la chiara spiegazione ed esempio, tutto questo ha senso. Tuttavia, dove dichiari You can't predict for subjects which were not part of the original (training) data; l'impostazione re.form=~0e la previsione dal valore atteso dalla popolazione non mi permettono di fare proprio questo? Certo, il modello non utilizza alcuna informazione specifica del soggetto nella previsione, ma è giusto dire che la stima da un modello a effetti misti sarà ancora più accurata di quella di un modello a effetto fisso equivalente in cui la variazione specifica del soggetto era ignorato?
tribalsoul,

1
Il modello fisso non è applicabile poiché le sue ipotesi sono state violate. È necessario utilizzare un modello che includa una struttura di dipendenza. re.form=~0ti dà la previsione a livello di popolazione, che è il massimo che puoi fare per i nuovi soggetti.
Roland,

Ho avuto la stessa domanda quando ho usato il glmmLasso pacchetto in R. L'autore del pacchetto, Andreas Groll, ha affermato che la procedura glmmLasso usa solo gli effetti fissi per fare previsioni per nuovi soggetti e effetti fissi + casuali per soggetti esistenti nel prossimo periodo di tempo.
RobertF
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.