Sto specificando correttamente il mio modello lmer?


9

Ho setacciato Google e questo sito e sono ancora confuso sulla funzione lmer nella libreria lme4.

Ho raccolto alcuni dati da diversi reparti psichiatrici, che hanno una struttura multilivello. Per semplificare, sceglierò due variabili di livello 2 e due di livello 1, anche se in realtà ne ho alcune.

Livello 2- WardSize [questo è il numero di persone nel reparto] & WAS [questa è una misura di quanto sia "bello" il reparto]

La variabile di raggruppamento che dice a R chi è in quale reparto è chiamato "Ward"

Livello uno - Genere [questo è genere, ovviamente] e BSITotale [questa è una misura della gravità dei sintomi]

Il risultato è Selfreject, che di nuovo è quello che sembra.

Ho questa formula:

help = lmer (formula = Selfreject ~ WardSize + WAS + sesso + BSITotal + (1 | Ward))

Spero che questo significhi "ogni individuo ha un punteggio correlato al proprio genere e alla gravità dei sintomi, nonché un effetto a livello di reparto relativo alla dimensione del reparto e alla sua" simpatia ".

È corretto? La cosa che mi confonde è che non riesco a vedere come R possa dire quali sono le variabili di livello 1 e quali di livello 2, fatta eccezione per l'intercettazione di livello di reparto fornita alla fine.

Se qualcuno potesse spiegare la notazione in modo che un idiota come me possa capire che sarebbe ancora meglio.

Grazie molto!

Risposte:


11

Le specifiche del tuo modello vanno bene.

L'intercettazione variabile per Ward, specificata in lmer come hai fatto con (1 | Ward), sta dicendo che i soggetti all'interno di ogni reparto potrebbero essere più simili tra loro su Selfreject per motivi diversi da WardSize o Gender, quindi stai controllando per eterogeneità tra i reparti.

Puoi pensare a "1" come una colonna di 1s (cioè una costante) nei dati a cui è adatta un'intercetta. Di solito "1" è implicito automaticamente in lm, per esempio

lm(Y ~ X1 + X2)

specifica in realtà

lm(Y ~ 1 + X1 + X2)

Ora che hai il tuo modello di base, puoi iniziare a porre ulteriori domande come "La relazione tra BSItotal e Selfreject differisce tra i reparti?"

lmer(formula=Selfreject ~ WardSize + WAS + Gender + BSITotal + (1 + BSITotal | Ward))

Cioè, sia l'intercettazione che l'inclinazione di BSITotal possono differire tra i reparti.

Se non l'hai ancora raccolto, Gelman & Hill's Data Analysis Using Regression and Multilevel Model / Hierarchical Models è un ottimo libro che spiega come installare modelli come questo con lmer.


1

Ecco un link a una spiegazione di Douglas Bates (che ha scritto lme4) sul perché non è necessario specificare il livello per gli effetti fissi.


2
Benvenuto nel sito, @Breyer. Sospetto che questo sia un contributo utile. Ti dispiacerebbe dare un breve riassunto dell'argomento lì, in modo che i lettori possano decidere se è quello che stanno cercando o in caso di linkrot futuro?
gung - Ripristina Monica

2
Grazie per il benvenuto @gung. Certo, Bates spiega che non è necessario specificare i livelli per gli effetti fissi perché il pacchetto lme4 è scritto per modelli misti, inclusi ma non limitati a modelli multilivello / gerarchici. Ciò significa che i metodi di calcolo non si basano sulla specifica dei livelli, come nel caso del software di regressione multilivello specializzato (HLM ecc.) Che sfrutta la struttura di dati nidificati nel calcolo.
Breyer
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.