Risolto vs Effetti casuali

10

Di recente ho iniziato a conoscere i modelli misti lineari generalizzati e stavo usando R per esplorare quale differenza fa per trattare l'appartenenza al gruppo come effetto fisso o casuale. In particolare, sto guardando il set di dati di esempio discusso qui:

http://www.ats.ucla.edu/stat/mult_pkg/glmm.htm

http://www.ats.ucla.edu/stat/r/dae/melogit.htm

Come indicato in questo tutorial, l'effetto di Doctor ID è apprezzabile e mi aspettavo il modello misto con un'intercettazione casuale per ottenere risultati migliori. Tuttavia, il confronto dei valori AIC per i due metodi suggerisce che questo modello è peggio:

> require(lme4) ; hdp = read.csv("http://www.ats.ucla.edu/stat/data/hdp.csv")
> hdp$DID = factor(hdp$DID) ; hdp$Married = factor(hdp$Married)
> GLM = glm(remission~Age+Married+IL6+DID,data=hdp,family=binomial);summary(GLM)

Call:
glm(formula = remission ~ Age + Married + IL6 + DID, family = binomial, 
data = hdp)

Deviance Residuals: 
Min       1Q   Median       3Q      Max  
-2.5265  -0.6278  -0.2272   0.5492   2.7329  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept) -1.560e+01  1.219e+03  -0.013    0.990    
Age         -5.869e-02  5.272e-03 -11.133  < 2e-16 ***
Married1     2.688e-01  6.646e-02   4.044 5.26e-05 ***
IL6         -5.550e-02  1.153e-02  -4.815 1.47e-06 ***
DID2         1.805e+01  1.219e+03   0.015    0.988    
DID3         1.932e+01  1.219e+03   0.016    0.987   

[...]

DID405       1.566e+01  1.219e+03   0.013    0.990    
DID405       1.566e+01  1.219e+03   0.013    0.990    
DID406      -2.885e-01  3.929e+03   0.000    1.000    
DID407       2.012e+01  1.219e+03   0.017    0.987    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 10353  on 8524  degrees of freedom
Residual deviance:  6436  on 8115  degrees of freedom
AIC: 7256

Number of Fisher Scoring iterations: 17


> GLMM = glmer(remission~Age+Married+IL6+(1|DID),data=hdp,family=binomial) ; m

Generalized linear mixed model fit by the Laplace approximation 
Formula: remission ~ Age + Married + IL6 + (1 | DID) 
Data: hdp 
AIC  BIC logLik deviance
7743 7778  -3867     7733
Random effects:
Groups Name        Variance Std.Dev.
DID    (Intercept) 3.8401   1.9596  
Number of obs: 8525, groups: DID, 407

Fixed effects:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.461438   0.272709   5.359 8.37e-08 ***
Age         -0.055969   0.005038 -11.109  < 2e-16 ***
Married1     0.260065   0.063736   4.080 4.50e-05 ***
IL6         -0.053288   0.011058  -4.819 1.44e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Correlation of Fixed Effects:
         (Intr) Age    Marrd1
Age      -0.898              
Married1  0.070 -0.224       
IL6      -0.162  0.012 -0.033


> extractAIC(GLM) ; extractAIC(GLMM)

[1]  410.000 7255.962
[1]    5.000 7743.188

Pertanto, le mie domande sono:

(1) È opportuno confrontare i valori AIC forniti dalle due funzioni? In tal caso, perché il modello a effetti fissi funziona meglio?

(2) Qual è il modo migliore per identificare se gli effetti fissi o casuali sono più importanti (cioè per quantificare che la variabilità dovuta al medico è più importante delle caratteristiche del paziente?

r random-effects-model glmm

— Guest333
fonte

7

Modelli di effetti fissi e modelli di effetti casuali pongono diverse domande sui dati. La specifica di un insieme di variabili fittizie a livello di gruppo controlla essenzialmente tutta l'eterogeneità non osservata a livello di gruppo nella risposta media, lasciando le stime per riflettere solo la variabilità all'interno delle unità. I modelli di effetti casuali iniziano con l'ipotesi che vi sia una metapopolazione di (qualunque sia l'effetto) e che il campione rifletta molte estrazioni da quella popolazione. Quindi, piuttosto che ancorare i tuoi risultati a intercettazioni eterogenee, i tuoi dati saranno usati per chiarire i parametri di quella distribuzione (normalmente normale) da cui presumibilmente i tuoi dati sono stati estratti.

Si dice spesso che i modelli di effetti fissi sono buoni per condurre un'inferenza sui dati che hai e che i modelli di effetti casuali sono buoni per cercare di condurre un'inferenza su una popolazione più ampia da cui i tuoi dati sono un campione casuale.

Quando ho saputo dei modelli a effetti fissi, sono stati motivati utilizzando componenti di errore e dati del pannello. Prendi più osservazioni di una data unità e un trattamento casuale nel tempo $t$ .

y_{io t} = α_{io} + β T_{io t} + ε_{io t}

$y_{it} = \alpha_i + \beta T_{it} + \epsilon_{it}$

Puoi suddividere il termine di errore in quel componente del termine di errore che varia nel tempo e uno che non:

y_{io t} = α_{io} + β T_{io t} + e_{io} + u_{io t}

$y_{it} = \alpha_i + \beta T_{it} + e_i + u_{it}$

Ora sottrai la media groupwise da entrambi i lati:

y_{io t} - {\bar{y}}_{io} = α_{io} - {\bar{α}}_{io} + β (T_{io t} - {\bar{T}}_{io}) + e_{io} - {\bar{e}}_{io} + u_{io t} - {\bar{u}}_{io} t

$y_{it} - \bar y_i = \alpha_i - \bar \alpha_i + \beta \left(T_{it}- \bar T_i\right) + e_i - \bar e_i+ u_{it}- \bar u_it$

Cose che non sono sottoscritte da $t$ uscire dall'equazione per sottrazione di base - vale a dire che la media nel tempo è la stessa di sempre, se non cambia mai. Ciò include il componente che non varia nel tempo del termine di errore. Pertanto le tue stime non sono fondate dall'eterogeneità invariante nel tempo.

Questo non funziona abbastanza per un modello di effetti casuali - il tuo non- $t$ variabili non indicizzate non verranno assorbite da tale trasformazione (la trasformazione "all'interno"). Come tale, puoi trarre deduzione dagli effetti di cose che non variano all'interno del gruppo. Nel mondo reale, queste cose hanno importanza. Pertanto, gli effetti casuali sono utili per "modellare i dati", mentre i modelli a effetti fissi sono utili per avvicinarsi a stime imparziali di termini particolari. Con un modello a effetti casuali, non è possibile dichiarare di averlo rimosso $e_i$ interamente.

In questo esempio, il tempo è la variabile di raggruppamento. Nel tuo esempio, è DID. (cioè: generalizza)

— generic_user
fonte

1

1) È opportuno effettuare il confronto, ma non con questi due modelli. Vorresti confrontare:

GLM <- glm(remission~Age+Married+IL6, data=hdp, family=binomial)

con

GLMM <- glmer(remission~Age+Married+IL6+(1|DID), data=hdp, family=binomial)

e puoi farlo con un anova:

anova(GLM, GLMM)

(Non sono sicuro che funzionerà con i risultati glme glmer, in quanto potrebbero essere oggetti R diversi. Potrebbe essere necessario utilizzare due funzioni con oggetti di ritorno comparabili, come lmee gls, o fare l'anova da soli.)

L'anova eseguirà un test del rapporto log-verosimiglianza per vedere se l'aggiunta dell'effetto medico casuale è significativa. Dovresti dividere quel valore p per 2 prima di dichiarare la significatività perché stai testando l'ipotesi nulla che l'effetto medico casuale sia 0 e 0 sia sul limite dello spazio dei parametri per una varianza (la distribuzione effettiva che stai usando in il test è una miscela di $\chi^2_0$ e $\chi^2_1$ distribuzione - ma sono vicino al limite della mia ignoranza a questo punto).

Per me, il miglior libro per comprendere il processo di costruzione di modelli nidificati e test di ipotesi è stato West, Welsh e Galecki (2007) Modelli lineari misti: una guida pratica . Attraversano tutto passo dopo passo.

2) Se si hanno più osservazioni per paziente, si aggiungerebbe anche un effetto casuale per il paziente. Quindi, per testare l'importanza relativa della pazienza rispetto al medico, è possibile esaminare gli effetti predittivi del paziente rispetto agli effetti predittivi per il medico. I termini degli effetti casuali per ciascuno quantificheranno la quantità di varianza tra i pazienti e tra i medici, se questa è una domanda che ti interessa.

(Qualcuno, per favore, correggimi se sbaglio!)

— Christopher Poile
fonte

Non sono sicuro che ha senso avere DIDcome sia un effetto fisso, e un'intercettazione casuale nel secondo modello. Inoltre, averlo come effetto fisso nel 1 ° modello significa che la scelta tra questi 2 sarebbe su quale modo di pensare all'effetto DID, non se debba essere incluso. In un'altra nota, noto che hai un oggetto (2); intendevi avere un oggetto (1) da qualche parte?

— gung - Ripristina Monica

Hai assolutamente ragione; Stavo andando dalla formula glm originale dell'OP che non avrebbe dovuto avere DID come effetto fisso in primo luogo. Ora la scelta è se trattare il DID come un effetto casuale aggiunge valore al modello.

— Christopher Poile,

1

I modelli sono molto diversi. Il modello glm sta affrontando la riduzione complessiva della devianza (da un modello null) quando tutti gli effetti doctorID vengono stimati e vengono assegnati stime dei parametri. Si nota, ovviamente, che Age, Married e IL6 hanno tutti le stesse statistiche Wald nei due modelli, giusto? La mia comprensione (non altamente raffinata, lo ammetterò) è che il modello misto sta trattando i doctorID come fattori o strati di disturbo, vale a dire "effetti" che non si può presumere siano derivati da una particolare distribuzione dei genitori. Non vedo alcun motivo per pensare che l'uso di un modello misto migliorerebbe la tua comprensione dell '"effetto medico", anzi il contrario.

Se il tuo interesse fosse per gli effetti di Age, Married o IL6, avrei immaginato che non avresti confrontato l'AIC tra questi due modelli, ma piuttosto attraverso le differenze nell'AIC con la rimozione delle covariate di interesse all'interno della stessa struttura di modellazione.

— DWin
fonte