Considera un modello misto lineare semplice, ad esempio un modello di intercettazione casuale in cui stimiamo la dipendenza di su x in soggetti diversi e supponiamo che ogni soggetto abbia una propria intercettazione casuale: y = a + b x + c i + ϵ . Qui le intercettazioni c i sono modellate come provenienti da una distribuzione gaussiana c i ∼ N ( 0 , τ 2 ) e il rumore casuale è anche gaussiano ϵ ∼ N ( 0 , ) .yx
y=a+bx+ci+ϵ.
cici∼N(0,τ2)
ϵ∼N(0,σ2).
Nel
lme4
sintassi questo modello verrebbe scritto come
y ~ x + (1|subject)
.
È istruttivo riscrivere quanto sopra come segue:
y∣c∼N(a+bx+c,σ2)c∼N(0,τ2)
Questo è un modo più formale per specificare lo stesso modello probabilistico. Da questa formulazione possiamo vedere direttamente che gli effetti casuali non sono "parametri": sono variabili casuali non osservate. Quindi, come possiamo stimare i parametri di varianza senza conoscere i valori di c ?cic
Si noti che la prima equazione sopra descrive la distribuzione condizionale di data c . Se conosciamo la distribuzione di c e di y ∣ c , allora possiamo elaborare la distribuzione incondizionata di y integrando su c . Potresti conoscerlo come la Legge della probabilità totale . Se entrambe le distribuzioni sono gaussiane, anche la distribuzione incondizionata risultante è gaussiana.yccy∣cyc
In questo caso la distribuzione incondizionata è semplicemente , ma le nostre osservazioni non ne sono prive di campioni perché ci sono più misurazioni per soggetto. Per procedere, dobbiamo considerare la distribuzione dell'intero vettore n- dimensionale y di tutte le osservazioni: y ∼ N ( a + b x , Σ ) dove Σ = σ 2 I n + τ 2 IN(a+bx,σ2+τ2)ny
y∼N(a+bx,Σ)
è una matrice diagonale a blocchi composta da
σ 2 e
τ 2 . Hai chiesto intuizione, quindi voglio evitare la matematica. Il punto importante è che questa equazione non hapiù
c !
Questoè ciò che uno in realtà si adatta ai dati osservati, ed è per questo si dice che
c iΣ=σ2In+τ2IN⊗1Mσ2τ2cci non sono i parametri del modello.
Quando i parametri , b , τ 2 e σ 2 sono adeguati, si può calcolare la distribuzione condizionale di c i per ciascuno i . Quello che vedi nell'output del modello misto sono le modalità di queste distribuzioni, ovvero le modalità condizionali.abτ2σ2cii