Perché i modelli di effetti misti risolvono la dipendenza?


14

Supponiamo che siamo interessati a come i voti degli esami degli studenti sono influenzati dal numero di ore che quegli studenti studiano. Per esplorare questa relazione, potremmo eseguire la seguente regressione lineare:

exam.gradesio=un'+β1×hours.studiedio+eio

Ma se campioniamo gli alunni di diverse scuole, potremmo aspettarci che gli alunni della stessa scuola siano più simili tra loro rispetto agli alunni di scuole diverse. Per far fronte a questo problema di dipendenza, il consiglio di molti libri di testo / sul web è di eseguire effetti misti e di entrare a scuola come effetto casuale. Quindi il modello diventerebbe:

exam.gradesi=a+β1×hours.studiedi+schoolj+ei
Ma perché questo risolve il problema di dipendenza che era presente nella regressione lineare?

Ti preghiamo di rispondere come se stessi parlando con un bambino di 12 anni


Se "risolve" il problema di dipendenza è specifico del contesto. Ma probabilmente puoi vedere che ora il modello esteso ha un termine che può, almeno in parte, spiegare un effetto correlato a una scuola particolare.
image_doctor

Risposte:


23

Includere termini casuali nel modello è un modo per indurre una struttura di covarianza tra i voti. Il fattore casuale per la scuola induce una covarianza diversa da zero tra studenti diversi della stessa scuola, mentre è quando la scuola è diversa.0

Scriviamo il tuo modello come dove s indicizza la scuola e io indicizza gli studenti (in ogni scuola). I termini della scuola s sono variabili aleatorie indipendenti disegnati in uno N ( 0 , T si ) . Le e s , i sono variabili indipendenti casuali disegnati in uno N ( 0 , σ

YS,io=α+oreS,ioβ+scuolaS+eS,io
SioscuolaSN(0,τ)eS,io .N(0,σ2)

Questo vettore ha un valore atteso che è determinato dal numero di ore lavorate.

[α+oreS,ioβ]S,io

La covarianza tra e Y s , i è 0 quando s s , il che significa che la partenza dei voti dai valori previsti è indipendente quando gli studenti non sono nella stessa scuola.YS,ioYS',io'0SS'

La covarianza tra e Y s , i è τ quando i i e la varianza di Y s , i è τ + σ 2 : i voti degli studenti della stessa scuola avranno correlato gli scostamenti dai loro valori previsti .YS,ioYS,io'τioio'YS,ioτ+σ2

Esempio e dati simulati

Ecco una breve simulazione R per cinquanta studenti di cinque scuole (qui prendo ); i nomi della variabile sono auto documentanti: σ2=τ=1

set.seed(1)
school        <- rep(1:5, each=10)
school_effect <- rnorm(5)

school_effect_by_ind <- rep(school_effect, each=10)
individual_effect    <- rnorm(50)

Tracciamo le partenze dal voto previsto per ogni studente, cioè i termini , insieme a (linea tratteggiata) la partenza media per ogni scuola:scuolaS+eS,io

plot(individual_effect + school_effect_by_ind, col=school, pch=19, 
     xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)

modello misto

Ora commentiamo questa trama. Il livello di ciascuna linea tratteggiata (corrispondente alla ) è disegnato in modo casuale in una legge normale. I termini casuali specifici dello studente sono anche disegnati a caso in una legge normale, corrispondono alla distanza dei punti dalla linea tratteggiata. Il valore risultante è, per ogni studente, la partenza da α + ore β , il voto determinato dal tempo impiegato per lavorare. Di conseguenza, gli alunni della stessa scuola sono più simili tra loro rispetto agli alunni di scuole diverse, come hai affermato nella tua domanda.scuolaSα+oreβ

La matrice di varianza per questo esempio

Nelle simulazioni di cui sopra attingiamo a parte la scuola effetti e gli effetti individuali e s , i , quindi le considerazioni di covarianza con cui ho iniziato non sembrano chiaramente qui. In effetti, avremmo ottenuto risultati simili disegnando un vettore normale casuale di dimensione 50 con matrice di covarianza a blocchi diagonali [ A 0 0 0 0 0 A 0 0 0 0 0 A 0 0 0 0 0 A 0 0 0 0 0 A ] dove ciascuno dei cinquescuolaSeS,io

[UN00000UN00000UN00000UN00000UN]
blocchi A corrispondono alla covarianza tra gli studenti di una stessa scuola: A = [ 2 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 1 1 1 1 2 110×10UN
UN=[2111111111121111111111211111111112111111111121111111111211111111112111111111121111111111211111111112].

1
Elvis: questa è probabilmente un'ottima risposta per le persone più esperte nelle statistiche rispetto a I. Comunque posso estrarne poco significato. Potresti modificare la tua risposta in modo che un dodicenne possa essere in grado di capire?
luciano,

1
A ... 12 anni ?! Wow! Aggiungerò alcune simulazioni, se questo può aiutare.
Elvis,

5
Fatto. Spero che sia di aiuto. In caso contrario, si prega di essere più specifici su ciò che non si ottiene. Nota che neanche un 12 anni capirà la domanda ... non puoi chiedere una risposta più semplice della domanda.
Elvis,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.