Domande su come vengono specificati gli effetti casuali in lmer


55

Di recente ho misurato il modo in cui il significato di una nuova parola viene acquisito su esposizioni ripetute (pratica: dal giorno 1 al giorno 10) misurando ERP (EEG) quando la parola veniva vista in contesti diversi. Ho anche controllato le proprietà del contesto, ad esempio, la sua utilità per la scoperta di nuovi significati delle parole (alto contro basso). Sono particolarmente interessato all'effetto della pratica (giorni). Poiché le singole registrazioni ERP sono rumorose, i valori dei componenti ERP sono ottenuti facendo la media delle prove di una particolare condizione. Con la lmerfunzione, ho applicato la seguente formula:

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

e

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Ho anche visto l'equivalente dei seguenti effetti casuali in letteratura:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Cosa si ottiene utilizzando un fattore casuale del modulo participants:context? Esiste una buona fonte che consentirebbe a qualcuno con una conoscenza superficiale dell'algebra matriciale di capire esattamente quali fattori casuali fanno nei modelli misti lineari e come dovrebbero essere selezionati?

Risposte:


77

Descriverò quale modello si lmer()adatta a ciascuna delle tue chiamate e come sono diverse e quindi risponderò alla tua ultima domanda sulla selezione di effetti casuali.

Ognuno dei tre modelli contengono effetti fissi per practice, contexte l'interazione tra i due. Gli effetti casuali differiscono tra i modelli.

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

participantsparticipant0

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Questo modello, oltre a un'intercettazione casuale, contiene anche una pendenza casuale in practice. Ciò significa che la velocità con cui gli individui apprendono dalla pratica è diversa da persona a persona. Se un individuo ha un effetto casuale positivo, allora aumenta più rapidamente con la pratica rispetto alla media, mentre un effetto casuale negativo indica che imparano meno rapidamente con la pratica rispetto alla media, o forse peggiorano con la pratica, a seconda della varianza del casuale effetto (questo presuppone che l'effetto fisso della pratica sia positivo).

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Questo modello si adatta a una pendenza casuale e intercetta in practice(devi fare (practice-1|...)per sopprimere l'intercettazione), proprio come il modello precedente, ma ora hai anche aggiunto una pendenza casuale e intercetta nel fattore participants:context, che è un nuovo fattore i cui livelli sono tutte le combinazioni dei livelli presenti in participantse contexte i corrispondenti effetti casuali sono condivisi da osservazioni che hanno lo stesso valore di entrambi participantse context. Per adattarsi a questo modello dovrai avere più osservazioni che hanno gli stessi valori per entrambi participantsecontextaltrimenti il ​​modello non è stimabile. In molte situazioni, i gruppi creati da questa variabile di interazione sono molto scarsi e producono modelli di effetti casuali molto rumorosi / difficili da adattare, quindi è necessario fare attenzione quando si utilizza un fattore di interazione come variabile di raggruppamento.

Fondamentalmente (leggi: senza diventare troppo complicato) si dovrebbero usare effetti casuali quando si pensa che le variabili di raggruppamento definiscono "tasche" di disomogeneità nel set di dati o che gli individui che condividono il livello del fattore di raggruppamento dovrebbero essere correlati tra loro (mentre individui che non dovrebbero essere correlati) - gli effetti casuali compiono questo. Se pensi che le osservazioni che condividono i livelli di entrambi participantse contextsiano più simili della somma delle due parti, potrebbe essere appropriato includere l'effetto casuale di "interazione".

Modifica: come menziona @Henrik nei commenti, i modelli che si adattano, ad esempio:

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base)

fare in modo che la pendenza casuale e l'intercetta casuale siano correlate tra loro e che la correlazione sia stimata dal modello. Per vincolare il modello in modo che la pendenza casuale e l'intercettazione casuale siano non correlate (e quindi indipendenti, poiché sono normalmente distribuite), dovresti invece adattarti al modello:

lmer(ERPindex ~ practice*context + (1|participants) + (practice-1|participants), 
     data=base)

La scelta tra questi due dovrebbe basarsi sul fatto che si pensi, ad esempio, che participants con una linea di base più alta della media (ovvero un'intercettazione casuale positiva) abbiano probabilmente un tasso di variazione più elevato della media (ovvero una pendenza casuale positiva). In tal caso, permetteresti che i due fossero correlati, altrimenti, li vinceresti come indipendenti. (Ancora una volta, questo esempio presuppone che la pendenza dell'effetto fisso sia positiva).


2
Non voglio essere pignolo, ma il secondo modello non contiene anche la correlazione tra l'intercettazione e le pendenze. L'aggiunta delle piste dovrebbe essere: lmer(ERPindex ~ practice*context + (1|participants) + (0 + practice|participants, data=base)o sbaglio? (Non correlato: scusa la mia piccola modifica del tuo post. Se non sei d'accordo con il chiarimento, cambialo di nuovo)
Henrik

@Henrik, sì, hai ragione, stima anche la correlazione tra i due effetti casuali. Nel scrivere questa risposta, stavo cercando di dare un'idea "generale" di ciò che sta succedendo con questi modelli, che non includeva menzionare la correlazione tra gli effetti casuali, che non ha una semplice descrizione "a due cent" come fanno la pendenza e l'intercetta :) In ogni caso, non credo che questa omissione renda errata l'interpretazione che ho fatto nella mia risposta. A proposito, grazie per la modifica.
Macro

1
@Henrik, ho aggiunto una nota sulla differenza tra rendere gli effetti casuali correlati e non correlati che penso migliora la risposta - grazie per averlo sottolineato.
Macro

Grazie. Sto cercando di entrare nella cosa della modellazione mista e anche di lottare con la domanda su come e quando usare quale struttura di effetti casuali, che volevo solo accertare. In breve, ottima risposta (+1).
Henrik

1
@pom, grazie per il complimento. Ri: il tuo commento, l'ho testato su dati simulati e penso che tu l'abbia indietro. Il secondo modello sotto la mia modifica ha un parametro in meno rispetto al primo. Questo perché il secondo modello limita la correlazione tra i due effetti casuali su zero. A parte questo, i modelli sono gli stessi. Non sono sicuro di ciò che stai incontrando, ma un esempio riproducibile sarebbe di aiuto. Ecco il mio:x <-rnorm(1000); id <- rep(1:100,each=10); y <- rnorm(1000); g <- lmer(y ~ (1+x|id)); g2 <- lmer(y ~ (1|id) + (x-1|id)); attr(logLik(g),"df"); attr(logLik(g2),"df");
Macro,

13

@Macro ha dato una buona risposta qui, voglio solo aggiungere un piccolo punto. Se alcune persone nella tua situazione stanno usando:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Sospetto che stiano commettendo un errore. Considera: (practice|participants)significa che c'è una pendenza casuale (e intercetta) per l'effetto di practiceper ciascuno participant, mentre (practice|participants:context)significa che c'è una pendenza casuale (e intercetta) per l'effetto di practiceper ogni participant by context combinazione . Va bene, se è quello che vogliono, ma sospetto che lo vogliano (practice:context|participants), il che significa che c'è una pendenza casuale (e intercetta) per l'effetto di interazione di practice by contextciascuno participant.


4

In un modello di effetti casuali o di effetti misti, un effetto casuale viene usato quando si desidera trattare l'effetto che si è osservato come se fosse tratto da una distribuzione di probabilità degli effetti.

Uno dei migliori esempi che posso dare è quando si modellano i dati degli studi clinici da uno studio clinico multicentrico. Un effetto del sito è spesso modellato come un effetto casuale. Questo perché i circa 20 siti effettivamente utilizzati nella sperimentazione sono stati estratti da un gruppo molto più ampio di potenziali siti. In pratica, la selezione potrebbe non essere stata casuale, ma può comunque essere utile trattarla come se fosse.

Mentre l'effetto del sito avrebbe potuto essere modellato come un effetto fisso, sarebbe difficile generalizzare i risultati a una popolazione più ampia se non prendessimo in considerazione il fatto che l'effetto per un diverso set selezionato di 20 siti sarebbe diverso. Considerarlo come un effetto casuale ci consente di spiegarlo in questo modo.


1
-1 perché questa risposta non affronta qui le domande reali.
ameba dice di reintegrare Monica il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.