In un modello misto lineare generalizzato logistico (famiglia = binomiale), non so come interpretare la varianza degli effetti casuali:
Random effects:
Groups Name Variance Std.Dev.
HOSPITAL (Intercept) 0.4295 0.6554
Number of obs: 2275, groups: HOSPITAL, 14
Come interpreto questo risultato numerico?
Ho un campione di pazienti trapiantati renali in uno studio multicentrico. Stavo testando se la probabilità che un paziente fosse trattato con un trattamento antiipertensivo specifico è la stessa tra i centri. La percentuale di pazienti trattati varia notevolmente tra i centri, ma può essere dovuta a differenze nelle caratteristiche basali dei pazienti. Quindi ho stimato un modello misto lineare generalizzato (logistico), adattando le caratteristiche principali dei pazienti. Questi sono i risultati:
Generalized linear mixed model fit by maximum likelihood ['glmerMod']
Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER)
Data: DATOS
AIC BIC logLik deviance
1815.888 1867.456 -898.944 1797.888
Random effects:
Groups Name Variance Std.Dev.
CENTER (Intercept) 0.4295 0.6554
Number of obs: 2275, groups: HOSPITAL, 14
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.804469 0.216661 -8.329 < 2e-16 ***
AGE -0.007282 0.004773 -1.526 0.12712
SEXFemale -0.127849 0.134732 -0.949 0.34267
BMI 0.015358 0.014521 1.058 0.29021
INMUNOTTOB 0.031134 0.142988 0.218 0.82763
INMUNOTTOC -0.152468 0.317454 -0.480 0.63102
log(SCR) 0.001744 0.195482 0.009 0.99288
log(PROTEINUR) 0.253084 0.088111 2.872 0.00407 **
Le variabili quantitative sono centrate. So che la deviazione standard tra gli ospedali dell'intercetta è 0,6554, in scala di probabilità del log. Poiché l'intercetta è -1.804469, nella scala delle probabilità logaritmiche, la probabilità di essere trattata con l'ipertensivo di un uomo, di età media, con valore medio in tutte le variabili e il trattamento intermuno A, per un centro "medio", è del 14,1% . E ora inizia l'interpretazione: presupponendo che gli effetti casuali seguano una distribuzione normale, ci aspetteremmo che circa il 95% dei centri abbia un valore entro 2 deviazioni standard della media zero, quindi la probabilità di essere trattati per l'uomo medio varierà tra i centri con intervallo di copertura di:
exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))
exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))
È corretto?
Inoltre, come posso testare in maniera più chiara se la variabilità tra i centri è statisticamente significativa? Lavoravo con MIXNO, un eccellente software di Donald Hedeker, e lì ho un errore standard della varianza della stima, che non ho in glmer. Come posso avere la probabilità di essere curato per l'uomo "medio" in ciascun centro, con un intervallo di confidenza?
Grazie