Notazione per la modellazione multilivello


10

La formula che uno deve specificare per allenare un modello multilivello (usando lmerdalla lme4 Rlibreria) mi dà sempre. Ho letto innumerevoli libri di testo ed esercitazioni, ma non l'ho mai capito bene.

Quindi, ecco un esempio di questo tutorial che vorrei vedere formulato in un'equazione. Stiamo cercando di modellare la frequenza della voce in funzione del genere (le femmine hanno una voce più acuta rispetto ai maschi in generale) e l'atteggiamento della persona (che abbia risposto in modo educato o informale) in diversi scenari. Inoltre, come puoi vedere dalla subjectcolonna, ogni persona è stata sottoposta a misurazioni più volte.

> head(politeness, n=20)
   subject gender scenario attitude frequency
1       F1      F        1      pol     213.3
2       F1      F        1      inf     204.5
3       F1      F        2      pol     285.1
4       F1      F        2      inf     259.7
5       F1      F        3      pol     203.9
6       F1      F        3      inf     286.9
7       F1      F        4      pol     250.8
8       F1      F        4      inf     276.8
9       F1      F        5      pol     231.9
10      F1      F        5      inf     252.4
11      F1      F        6      pol     181.2
12      F1      F        6      inf     230.7
13      F1      F        7      inf     216.5
14      F1      F        7      pol     154.8
15      F3      F        1      pol     229.7
16      F3      F        1      inf     237.3
17      F3      F        2      pol     236.8
18      F3      F        2      inf     251.0
19      F3      F        3      pol     267.0
20      F3      F        3      inf     266.0

subject, genderE attitudesono fattori (con informale femaleconsiderati livelli di base per attitudee gendernelle equazioni di seguito). Ora, un'idea è quella di formare un modello con intercettazioni diverse per ciascuno subjecte scenario:

politeness.model=lmer(frequency ~ attitude + gender + 
 (1|subject) + (1|scenario), data=politeness)

Se la mia comprensione della notazione è corretta, ciò corrisponde a:

yi=aj[i]1+ak[i]2+β attitude maschio ipoli+γ gendermalei

dove indica punto dati, indica il livello di gruppo per e indica il livello di gruppo per punto dati. e sono indicatori binari.i t h j [ i ] k [ i ]iithj[i]subjectk[i]scenario pol maschioithattitudepolgendermale

Per introdurre pendenze casuali per l'atteggiamento, possiamo scrivere:

politeness.model = lmer(frequency ~ attitude + gender + 
 (1+attitude|subject) + (1+attitude|scenario), data=politeness)

Ancora una volta, se la mia comprensione è chiara, ciò corrisponde a:

pol i + γ maschio iyi=aj[i]1+ak[i]2+(βj[i]1+βk[i]2) attitudepoli+γ gendermalei

Ora, a quale equazione Rcorrisponde il seguente comando?

politeness.null = lmer(frequency ~ gender +
 (1+attitude|subject) +  (1+attitude|scenario), data=politeness)

1
non molto sensibile; si assume che la pendenza media della popolazione rispetto all'atteggiamento sia zero ...
Ben Bolker,

@BenBolker: Ehi, puoi per favore scriverlo in una forma di equazione? Le mie equazioni precedenti sono corrette? Nell'ultimo modello, vedo ancora di attitudeessere condizionato su subjecte scenario.
abhinavkulkarni,

Risposte:


12

vorrei scrivere

~ attitude + gender + (1|subject) + (1|scenario)

come

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b2,k[i]+ϵib1N(0,σ12)b2N(0,σ22)ϵN(0,σr2)
dove indica un coefficiente a effetto fisso, indica una variabile casuale, è una funzione indicatore (sostanzialmente identica a quella che hai detto sopra, notazione leggermente diversa).βbI
~ attitude + gender + (1+attitude|subject) + (1+attitude|scenario)

aggiunge una variazione tra i soggetti in risposta a attitudee scenario(potremmo scrivere equivalentemente la parte degli effetti casuali come (attitude|subject) + (attitude|scenario), ovvero lasciare implicita l'intercettazione; questa è una questione di gusti). Adesso

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b3,j[i]I(attitude=pol)+b2,k[i]+b4,k[i]I(attitude=pol)+ϵi{b1,b3}MVN(0,Σ1){b2,b4}MVN(0,Σ2)ϵN(0,σr2)
dove e sono matrici varianza-covarianza non strutturate, ovvero simmetriche e positive (semi) definito ma non ha altri vincoli: e similmente per .Σ1Σ2
Σ1=(σ12σ13σ13σ32)
Σ2

Potrebbe essere istruttivo raggruppare i termini come segue: così puoi vedere quali effetti casuali influenzano l'intercettazione e quali influenzano la risposta all'atteggiamento.

yi(β0+b1,j[i]+b2,k[i])+(β1+b3,j[i]+b4,k[i])I(attitude=pol)+β2I(gender=male)+ϵi

Ora, se tralasci il attitudetermine a effetto fisso (es. Set , o il termine dalla formula) puoi vedere (senza riscrivere tutto) che, poiché si presume che gli effetti casuali abbiano una media zero, saremo supponendo che la risposta media all'atteggiamento tra soggetti e scenari sarà esattamente zero, mentre vi sono ancora variazioni tra soggetti e scenari. Non dirò che questo non ha mai senso da un punto di vista statistico, ma raramente lo fa. Ci sono discussioni di questo problema sulla mailing list r-sig-mixed-models@r-project.org di volta in volta ... (o potrebbe essere discusso su StackExchange da qualche parte - in caso contrario, farebbe un buon seguito -up domanda SE ...)β1=0attitude

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.