REML vs ML stepAIC


10

Mi sento sopraffatto dopo aver tentato di approfondire la letteratura su come eseguire la mia analisi di modelli misti seguendola con l'utilizzo di AIC per selezionare il modello oi modelli migliori. Non credo che i miei dati siano così complicati, ma sto cercando conferma che ciò che ho fatto sia corretto, e quindi consigli su come procedere. Non sono sicuro se dovrei usare lme o lmer e poi con uno di questi, se dovrei usare REML o ML.

Ho un valore di selezione e voglio sapere quali covariate influenzano meglio quel valore e consentono previsioni. Ecco alcuni dati di esempio inventati e il mio codice per il mio test con cui sto lavorando:

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

Ho ~ 19 modelli che esplorano questi dati con varie combinazioni e termini di interazione fino a 2, ma sempre con ID come effetto casuale e comp1 come mia variabile dipendente.

  • Q1. Quale usare? Lme o Lmer? importa?

In entrambi, ho la possibilità di usare ML o REML - e ottengo risposte drasticamente diverse - usando ML seguito da AIC finisco con 6 modelli tutti con valori AIC simili e le combinazioni di modelli semplicemente non hanno senso, mentre REML risulta che 2 dei modelli più probabili siano i migliori. Tuttavia, quando eseguo REML non posso più usare anova.

  • Q2. è il motivo principale per utilizzare ML su REML a causa dell'uso con ANOVA? Questo non mi è chiaro.

Non sono ancora in grado di eseguire stepAIC o non conosco un altro modo per restringere quei 19 modelli.

  • Q3. c'è un modo per usare stepAIC a questo punto?

3
Per Q2, ML è necessario perché i confronti con REML non sono validi quando cambiano gli effetti fissi. Una possibile utile domanda correlata è qui: stats.stackexchange.com/a/16015/3601
Aaron ha lasciato Stack Overflow il

@Aaron Avevo già esaminato quella domanda, ma ero ancora confuso. Utilizzare REML "funziona" solo quando l'effetto casuale cambia? Ovviamente non capisco abbastanza di ML vs REML. Grazie, però, aiuta con una delle mie domande!
Kerry,

Si, è corretto. Quando si confrontano i modelli, REML dovrebbe essere usato solo se i modelli hanno gli stessi effetti fissi. Risposta espansa di seguito.
Aaron ha lasciato Stack Overflow il

Risposte:


16

Q1. Quale usare? Lme o Lmer? importa? O va bene. Ti daranno gli stessi attacchi. lmeti darà valori p e lmernon lo farà, ma è più di quello che voglio entrare qui. Il riferimento più famoso è uno dei post di Doug Bates nella mailing list di R-help qui .

(avvertenza: usano algoritmi leggermente diversi, quindi ci sono potenzialmente alcuni casi computazionalmente difficili in cui l'uno o l'altro potrebbero fare meglio, ma quelli sono molto rari nella pratica e in realtà, molto probabilmente indicano un qualche tipo di errata specificazione del modello. Vedi Completamente diverso risultati da lmer () e lme () .)

Q2. è il motivo principale per utilizzare ML su REML a causa dell'uso con ANOVA? Questo non mi è chiaro. ML è necessario perché i confronti con REML non sono validi quando cambiano gli effetti fissi. Una possibile utile domanda correlata è qui: https://stats.stackexchange.com/a/16015/3601 . Per rispondere alla tua domanda nel commento sopra, sì, quando si confrontano i modelli, REML dovrebbe essere usato solo se i modelli hanno gli stessi effetti fissi (vale a dire, quando cambiano solo gli effetti casuali). La probabilità REML dipende da quali effetti fissi sono presenti nel modello e quindi non sono comparabili se gli effetti fissi cambiano. REML è generalmente considerato per fornire stime migliori per gli effetti casuali, quindi il consueto consiglio è di adattare il tuo modello migliore usando REML per la tua inferenza e rendicontazione finale.

Q3. c'è un modo per usare stepAIC a questo punto? Per confrontare tra i tuoi 19 modelli che hanno senso nella tua situazione, basta confrontare l'AIC per tutti loro. Nessun motivo per utilizzare una procedura graduale. Al giorno d'oggi le procedure graduali sono generalmente considerate antiquate in quanto non garantiscono la ricerca del modello migliore e i computer semplificano il confronto di molti modelli.


1

Per approfondire, ho anche trovato queste risorse che supportano i collegamenti forniti da Aaron e sono buone letture per coloro che stanno iniziando come me. I capitoli collegati su http://lme4.r-forge.r-project.org/ per esempi danno un'occhiata al link delle diapositive http://lme4.r-forge.r-project.org/slides/ nella stessa pagina del progetto . Molti dei corsi brevi hanno anche un esempio di codice R che è stato di grande aiuto.
Anche questa breve risposta del Dr. Bolker http://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.