REML o ML per confrontare due modelli di effetti misti con diversi effetti fissi, ma con lo stesso effetto casuale?


18

Sfondo: Nota: il mio set di dati e il codice r sono inclusi sotto il testo

Vorrei usare AIC per confrontare due modelli di effetti misti generati usando il pacchetto lme4 in R. Ogni modello ha un effetto fisso e un effetto casuale. L'effetto fisso differisce tra i modelli, ma l'effetto casuale rimane lo stesso tra i modelli. Ho scoperto che se uso REML = T, model2 ha il punteggio AIC più basso, ma se uso REML = F, model1 ha il punteggio AIC più basso.

Supporto per l'utilizzo di ML:

Zuur et al. (2009; PAGINA 122) suggeriscono che "Per confrontare i modelli con effetti fissi nidificati (ma con la stessa struttura casuale), è necessario utilizzare la stima ML e non REML." Questo mi indica che dovrei usare ML poiché i miei effetti casuali sono gli stessi in entrambi i modelli, ma i miei effetti fissi differiscono. [Zuur et al. 2009. Modelli di effetti misti ed estensioni in ecologia con R. Springer.]

Supporto per l'utilizzo di REML:

Tuttavia, noto che quando uso ML, la varianza residua associata agli effetti casuali differisce tra i due modelli (modello1 = 136.3; modello2 = 112.9), ma quando uso REML, è lo stesso tra i modelli (modello1 = modello2 = 151,5). Ciò implica per me che dovrei invece usare REML in modo che la varianza residua casuale rimanga la stessa tra i modelli con la stessa variabile casuale.

Domanda:

Non ha più senso usare REML che ML per confronti di modelli in cui gli effetti fissi cambiano e gli effetti casuali rimangono gli stessi? In caso contrario, puoi spiegare perché o indicarmi altre pubblicazioni che spiegano di più?

# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)

# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)

dataset:

Response    Fixed1  Fixed2  Random1
5.20    A   A   1
32.50   A   A   1
6.57    A   A   2
24.77   A   B   3
41.69   A   B   3
34.29   A   B   4
1.80    A   B   4
10.00   A   B   5
15.56   A   B   5
4.44    A   C   6
21.65   A   C   6
9.20    A   C   7
4.11    A   C   7
12.52   B   D   8
0.25    B   D   8
27.34   B   D   9
11.54   B   E   10
0.86    B   E   10
0.68    B   E   11
4.00    B   E   11

2
Faraway's (2006) Estensione del modello lineare con R (p. 156): "Il motivo è che REML stima gli effetti casuali considerando le combinazioni lineari dei dati che rimuovono gli effetti fissi. Se questi effetti fissi vengono modificati, le probabilità del due modelli non saranno direttamente comparabili ".
jvh_ch,

Anche se AIC è basato sulla probabilità, per quanto ne sappia, è stato sviluppato ai fini della previsione. Come si applica esattamente un modello misto per la previsione?
AdamO,

@AdamO, potresti essere più preciso? Un modello misto adattato può essere utilizzato per la previsione, sia a livello di popolazione (prevedere le risposte per un'unità non specificata / sconosciuta impostando le modalità condizionate / BLUP su zero) o a livello individuale (previsione delle condizioni sulle stime delle modalità condizionate / BLUP ). Se puoi essere più specifico, potrebbe essere una buona nuova domanda CV.
Ben Bolker,

Per me non era chiaro come si intendesse applicare questo modello. Nulla nel problema ha suggerito che tipo di previsione, se presente, è stata fatta o se è stata necessaria e, in caso affermativo, per quale scopo.
AdamO,

Risposte:


22

Zuur et al. E Faraway (dal commento di @ janhove sopra) hanno ragione; l'uso di metodi basati sulla verosimiglianza (incluso AIC) per confrontare due modelli con diversi effetti fissi che sono montati da REML porterà in genere a sciocchezze.


4
Grazie @janhove, AdamO e Ben Bolker. Ho anche trovato utile questo link di Aaron per rispondere a questa domanda. Dice: "La probabilità REML dipende da quali effetti fissi sono nel modello, e quindi non sono comparabili se gli effetti fissi cambiano. REML è generalmente considerato per fornire stime migliori per gli effetti casuali, quindi il consiglio consueto è quello di adattarsi il tuo miglior modello usando REML per la tua inferenza e rendicontazione finale ".
E 'Figure

11

XX~RnX~XB

X~=XB

BXB

V

|V|1/2|X~V1X~|1/2exp((yX~β~)V1(yX~β~)/2)

β=(X~V1X~)1yX=X~B

|B||V|1/2||XV1X|1/2|exp((yXβ¯)V1(yXβ¯)/2)

β¯=(XV1X)1y|B|

|B|1

Questo è un esempio del perché REML non dovrebbe essere usato quando si confrontano modelli con diversi effetti fissi. REML, tuttavia, spesso stima meglio i parametri degli effetti casuali e pertanto a volte si consiglia di utilizzare ML per i confronti e REML per stimare un singolo modello (forse finale).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.