Come interpretare la varianza dell'effetto casuale in un modello misto lineare generalizzato


9

In un modello misto lineare generalizzato logistico (famiglia = binomiale), non so come interpretare la varianza degli effetti casuali:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Come interpreto questo risultato numerico?

Ho un campione di pazienti trapiantati renali in uno studio multicentrico. Stavo testando se la probabilità che un paziente fosse trattato con un trattamento antiipertensivo specifico è la stessa tra i centri. La percentuale di pazienti trattati varia notevolmente tra i centri, ma può essere dovuta a differenze nelle caratteristiche basali dei pazienti. Quindi ho stimato un modello misto lineare generalizzato (logistico), adattando le caratteristiche principali dei pazienti. Questi sono i risultati:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

Le variabili quantitative sono centrate. So che la deviazione standard tra gli ospedali dell'intercetta è 0,6554, in scala di probabilità del log. Poiché l'intercetta è -1.804469, nella scala delle probabilità logaritmiche, la probabilità di essere trattata con l'ipertensivo di un uomo, di età media, con valore medio in tutte le variabili e il trattamento intermuno A, per un centro "medio", è del 14,1% . E ora inizia l'interpretazione: presupponendo che gli effetti casuali seguano una distribuzione normale, ci aspetteremmo che circa il 95% dei centri abbia un valore entro 2 deviazioni standard della media zero, quindi la probabilità di essere trattati per l'uomo medio varierà tra i centri con intervallo di copertura di:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

È corretto?

Inoltre, come posso testare in maniera più chiara se la variabilità tra i centri è statisticamente significativa? Lavoravo con MIXNO, un eccellente software di Donald Hedeker, e lì ho un errore standard della varianza della stima, che non ho in glmer. Come posso avere la probabilità di essere curato per l'uomo "medio" in ciascun centro, con un intervallo di confidenza?

Grazie

Risposte:


10

È probabilmente molto utile se ci mostri ulteriori informazioni sul tuo modello, ma: il valore di base delle probabilità di registro di qualunque sia la tua risposta (ad es. Mortalità) varia tra gli ospedali. Il valore di base (il termine di intercettazione per ospedale) è il log-odds di mortalità (o qualsiasi altra cosa) nella categoria di base (ad esempio "non trattata"), a un valore zero di tutti i predittori continui. Si presume che tale variazione sia normalmente distribuita, sulla scala delle probabilità del registro. La deviazione standard tra gli ospedali dell'intercetta è 0,6554; la varianza (solo la deviazione standard al quadrato - non una misura dell'incertezza della deviazione standard) è .0.65542=0.4295

(Se chiarisci la tua domanda / aggiungi ulteriori dettagli sul tuo modello, posso provare a dire altro.)

aggiornamento : la tua interpretazione della variazione sembra corretta. Più precisamente,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

dovrebbe darti l'intervallo del 95% (non proprio intervalli di confidenza, ma molto simili) per le probabilità di una persona di base (maschio / età media / ecc.) che viene curata negli ospedali.

Per testare il significato dell'effetto casuale, hai una varietà di scelte (vedi http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html per maggiori informazioni). (Si noti che l'errore standard di una varianza RE di solito non è un modo affidabile per testare la significatività, poiché la distribuzione del campionamento è spesso distorta / non normale.) L'approccio più semplice è quello di eseguire un test del rapporto di verosimiglianza, ad es.

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

La divisione finale per 2 corregge il fatto che il test del rapporto di verosimiglianza è conservativo quando il valore null (ovvero varianza RE = 0) si trova al limite dello spazio possibile (ovvero la varianza RE non può essere <0).


Ho modificato la domanda
user2310909 il

1
Grazie, è un piacere leggere a qualcuno che conosce bene l'argomento.
user2310909,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.