Cosa sono le strutture a R in una glmm?


16

Ho usato il MCMCglmmpacchetto di recente. Sono confuso da ciò che viene indicato nella documentazione come struttura a R e struttura a G. Questi sembrano riguardare gli effetti casuali - in particolare specificando i parametri per la distribuzione precedente su di essi, ma la discussione nella documentazione sembra presumere che il lettore sappia quali sono questi termini. Per esempio:

elenco opzionale di specifiche precedenti con 3 possibili elementi: R (struttura a R) G (struttura a G) e B (effetti fissi) ............ I priori per le strutture di varianza (R e G ) sono elenchi con il (co) varianze atteso (V) e il parametro grado di convinzione (nu) per l'inverso-Wishart

... preso da qui .

EDIT: Nota che ho riscritto il resto della domanda seguendo i commenti di Stephane.

Qualcuno può fare luce su ciò che la struttura R e la struttura G sono, nel contesto di un modello di componenti di varianza semplice in cui il predittore lineare è

β0+e0ij+u0j
con e0ijN(0,σ0e2) ed u0jN(0,σ0u2)

Ho fatto il seguente esempio con alcuni dati forniti MCMCglmm

> require(MCMCglmm)
> require(lme4)
> data(PlodiaRB)
> prior1 = list(R = list(V = 1, fix=1), G = list(G1 = list(V = 1, nu = 0.002)))
> m1 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior1, verbose = FALSE)
> summary(m1)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8529   0.2951    1.455      160

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units         1        1        1        0

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1630  -1.4558  -0.8119    463.1 <0.001 ***
---

> prior2 = list(R = list(V = 1, nu = 0), G = list(G1 = list(V = 1, nu = 0.002)))
> m2 <- MCMCglmm(Pupated ~1, random = ~FSfamily, family = "categorical", 
+ data = PlodiaRB, prior = prior2, verbose = FALSE)
> summary(m2)


 G-structure:  ~FSfamily

         post.mean l-95% CI u-95% CI eff.samp
FSfamily    0.8325   0.3101    1.438    79.25

 R-structure:  ~units

      post.mean l-95% CI u-95% CI eff.samp
units    0.7212  0.04808    2.427    3.125

 Location effects: Pupated ~ 1 

            post.mean l-95% CI u-95% CI eff.samp  pMCMC    
(Intercept)   -1.1042  -1.5191  -0.7078    20.99 <0.001 ***
---

> m2 <- glmer(Pupated ~ 1+ (1|FSfamily), family="binomial",data=PlodiaRB)
> summary(m2)
Generalized linear mixed model fit by the Laplace approximation 
Formula: Pupated ~ 1 + (1 | FSfamily) 
   Data: PlodiaRB 
  AIC  BIC logLik deviance
 1020 1029   -508     1016
Random effects:
 Groups   Name        Variance Std.Dev.
 FSfamily (Intercept) 0.56023  0.74849 
Number of obs: 874, groups: FSfamily, 49

Fixed effects:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -0.9861     0.1344  -7.336  2.2e-13 ***

Quindi, sulla base dei commenti di Stephane, penso che la struttura G sia per σ0u2 . Ma i commenti dicono anche che la struttura R è per tuttavia questo non sembra apparirenell'output.σ0e2lme4

Si noti che i risultati di lme4/glmer()sono coerenti con entrambi gli esempi di MCMC MCMCglmm.

Quindi, è la struttura R per e perché questo non appare nell'output per ?σ0e2lme4/glmer()


1
Con la terminologia SAS (ma forse è una terminologia più comune), la matrice G è la matrice di varianza degli effetti casuali e la matrice R è la matrice di varianza dei "termini di errori" (nel tuo caso forse è il residuo stimato varianza ?)σ0e2
Stéphane Laurent il

@ StéphaneLaurent grazie. Mi chiedevo se potesse essere stimato ma quando ho appreso per la prima volta del modello lineare generalizzato ricordo che σ 2 0 e non è stimato - viene calcolato solo "devianza" (come con ). Forse mi manca qualcosa? σ0e2σ0e2lme4
Joe King,

1
forse il senso della varianza residua non è chiaro quando la famiglia di distribuzione non è quella gaussiana
Stéphane Laurent,

1
@ Stéphane Laurent Sì! Si prega di vedere il mio commento alla risposta di Michael un minuto fa - per esito binario, dovrebbe essere risolto (come nei miei modelli nel mio PO)
Joe King

1
Quando si dispone di un modello ME / multilivello, esistono diverse varianti. Immagina il caso più semplice: . Vi è una variazione nelle intercettazioni b i e nel termine di errore ε i . G è spesso usato per la matrice var-covar degli effetti casuali (in questo caso uno scalare, σ 2 b ) e R i è per la matrice var-covar delle varianze residue ε iYi=β0+β1X+bi+εibiεiGσb2Riεidopo aver tenuto conto degli effetti casuali fissi e di quel cluster. Di solito è concepito come una matrice diagonale di 's. Inoltre, entrambe le dist sono considerate normali multivariate w / mean = 0. σ2
gung - Ripristina Monica

Risposte:


8

Preferirei pubblicare i miei commenti qui sotto come commento, ma questo non sarebbe abbastanza. Queste sono domande piuttosto che una risposta (semplicemente a @gung non mi sento abbastanza forte sull'argomento).

g(E(yu))=Xβ+Zuϕ1βu

g(E(yu,e))=Xβ+Zu+eϕ1

σe

Mi scuso per questi commenti approssimativi, ho appena dato una rapida occhiata a questo.


σeglmerMCMCglmmMCMCglmmϕ1

Scusa, le mie parole non erano del tutto appropriate. MCMCglmm è veramente bayesiano, ma non implementa esattamente il glmm classico (penso). Inoltre, devi essere consapevole del fatto che è difficile impostare i priori che danno un'inferenza sulle componenti della varianza vicino all'inferenza del frequentatore.
Stéphane Laurent,

Grazie ancora. Nel mio studio ho scoperto che posso usare la distribuzione inversa-wishart predefinita per i componenti di varianza MCMCglmmusando una varietà di parametri e gli intervalli credibili del 95% contengono sempre il valore di varianza per la stima degli effetti casuali, glmerquindi ho ritenuto ragionevole , ma come dovrei interpretare questo caso, che potrebbe non essere tipico, in cui il risultato che gli MCMCglmmintervalli non sono molto sensibili alla scelta del precedente? Forse dovrei fare una nuova domanda a riguardo?
Joe King,

σe=0σe0

σeσeσuglmer

11

Rσe21

GG .

Un'ultima nota, poiché la varianza residua non è fissata a zero, le stime non corrisponderanno a quelle di glmer. Devi ridimensionarli. Ecco un piccolo esempio (non si usano effetti casuali, ma si generalizza). Nota come la varianza della struttura R è fissata su 1.

# example showing how close the match is to ML without separation
m2 <- MCMCglmm(vs ~ mpg, data = mtcars, family = "categorical",
  prior = list(
    B = list(mu = c(0, 0), V = diag(2) * 1e10),
    R = list(V = 1, fix = 1)),
  nitt = 1e6, thin = 500, burnin = 10000)
summary(m2)

Ecco la costante di riscalaggio per la famiglia binomiale:

k <- ((16*sqrt(3))/(15*pi))^2

Ora dividi la soluzione per essa e ottieni le modalità posteriori

posterior.mode(m2$Sol/(sqrt(1 + k)))

Che dovrebbe essere abbastanza vicino a ciò che otteniamo glm

summary(glm(vs ~mpg, data = mtcars, family = binomial))

sapresti come specificare l'eteroschedasticità al primo livello in MCMCglmm? È quella la struttura R? Qual è la sintassi allora?
Maxim.K

@Joshua, puoi spiegare la "costante di riscatto per la famiglia binomiale"? PS: Per seed 123, ottengo (con la correzione) dai m2valori -8.164e 0.421; e dai glmvalori -8.833e 0.430.
Riassunto

La costante di riscalaggio si trova in Diggle et. al. ( amazon.de/Analysis-Longitudinal-Oxford-Statistical-Science/dp/… ) - secondo cran.r-project.org/web/packages/MCMCglmm/vignettes/… eq. 2.14 a pagina 47.
Ristrutturato l'
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.