Qual è la differenza tra equazioni di stima generalizzate e GLMM?

Sto eseguendo un GEE su dati sbilanciati a 3 livelli, usando un collegamento logit. In che modo differisce (in termini di conclusioni che posso trarre e significato dei coefficienti) da un GLM con effetti misti (GLMM) e collegamento logit?

Più in dettaglio: le osservazioni sono prove a singolo bernoulli. Sono raggruppati in classi e scuole. Utilizzo di R. Casewise omissione di NA. 6 predittori anche termini di interazione.

(Non sto lanciando i bambini per vedere se atterrano a testa in su.)

Sono propenso a esponenziare i coefficienti a rapporti di probabilità. Questo ha lo stesso significato in entrambi?

C'è qualcosa in agguato nella parte posteriore della mia mente sui "mezzi marginali" nei modelli GEE. Ho bisogno di spiegarmelo.

Grazie.

— Rosser
fonte

Le seguenti domande del CV parlano anche di questo materiale: Differenza tra modelli lineari generalizzati e modelli misti lineari generalizzati in SPSS ; Quando utilizzare equazioni di stima generalizzate rispetto a modelli di effetti misti? .

— gung - Ripristina Monica

In termini di interpretazione dei coefficienti, c'è una differenza nel caso binario (tra gli altri). Ciò che differisce tra GEE e GLMM è l' obiettivo dell'inferenza: media della popolazione o specifica del soggetto .

Consideriamo un semplice esempio inventato relativo al tuo. Vuoi modellare il tasso di fallimento tra ragazzi e ragazze in una scuola. Come nella maggior parte delle scuole (elementari), la popolazione degli studenti è divisa in aule. Osserva una risposta binaria da bambini nelle classi (cioè risposte binarie raggruppate per classe), dove se lo studente della classe superato e se ha fallito. E se lo studente della classe è maschio e 0 altrimenti. $Y$ $n_i$ $N$ $\sum_{i=1}^{N}n_{i}$ $Y_{ij}=1$ $j$ $i$ $Y_{ij}=0$ $x_{ij} =1$ $j$ $i$

Per introdurre la terminologia che ho usato nel primo paragrafo, puoi pensare alla scuola come alla popolazione e alle classi come materie .

Innanzitutto considera GLMM. GLMM sta adattando un modello a effetti misti. Le condizioni del modello sulla matrice del design fisso (che in questo caso comprende l'intercettazione e l'indicatore del genere) e tutti gli effetti casuali tra le classi che includiamo nel modello. Nel nostro esempio, includiamo un'intercettazione casuale, , che terrà conto delle differenze di base nel tasso di fallimento tra le classi. Quindi stiamo modellando $b_i$

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}, b_i\right)=\beta_0+\beta_1 x_{ij} + b_i$

Il rapporto di probabilità del rischio di fallimento nel modello precedente differisce in base al valore di che è diverso tra le classi. Pertanto le stime sono specifiche per soggetto . $b_i$

GEE, d'altra parte, sta adattando un modello marginale. Queste medie della popolazione modello . Stai modellando le aspettative solo sulla tua matrice di progettazione fissa.

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}\right)=\beta_0+\beta_1 x_{ij}$

Ciò è in contrasto con i modelli di effetti misti, come spiegato sopra, quali condizioni sulla matrice del design fisso e sugli effetti casuali. Quindi, con il modello marginale sopra che stai dicendo, "dimentica la differenza tra le classi, voglio solo il tasso di fallimento della popolazione (per quanto riguarda la scuola) e la sua associazione con il genere". Adatti il modello e ottieni un rapporto di probabilità che è il rapporto di probabilità medio della popolazione di fallimento associato al genere.

Quindi potresti scoprire che le tue stime dal tuo modello GEE potrebbero differire dalle tue stime dal tuo modello GLMM e questo perché non stanno stimando la stessa cosa.

(Per quanto riguarda la conversione da log-odds ratio a odds ratio esponenziando, sì, lo fai sia che si tratti di una stima a livello di popolazione o specifica del soggetto)

Alcune note / letteratura:

Per il caso lineare, la media della popolazione e le stime specifiche per soggetto sono le stesse.

Zeger, et al. 1988 ha mostrato che per la regressione logistica,

$\beta_M\approx \left[ \left(\frac{16\sqrt{3}}{15\pi }\right)^2 V+1\right]^{-1/2}\beta_{RE}$

dove sono le stime marginali, sono le stime specifiche del soggetto e è la varianza degli effetti casuali. $\beta_M$ $\beta_{RE}$ $V$

Molenberghs, Verbeke 2005 ha un intero capitolo sui modelli di effetti marginali e casuali.

Ho imparato questo e materiale correlato in un corso basato molto su Diggle, Heagerty, Liang, Zeger 2002 , un ottimo riferimento.

Mike: È eccessivamente semplice affermare che un GEE fa la media degli effetti casuali?

— B_Miner,

@B_Miner Non è affatto troppo semplice, è esattamente quello che stai facendo :)

@Mike Wierzbicki: bella e pulita risposta, Mike! Un piccolo dettaglio che potrei aggiungere nel tuo "Alcune note / letteratura": GEE e GLMM sono gli stessi nel caso lineare (risposta gaussiana, collegamento di identità) solo quando si specifica una matrice di correlazione intercambiabile per GEE.

Non esiste anche un GEE specifico per soggetto?

— giordano,

@MikeWierzbicki Quindi, se ti capisco correttamente, un GEE non è altro che un semplice modello a effetti misti senza effetti casuali (che lo rende quindi una semplice linea di regressione non lineare)?

— Robin Kramer,