In termini di interpretazione dei coefficienti, c'è una differenza nel caso binario (tra gli altri). Ciò che differisce tra GEE e GLMM è l' obiettivo dell'inferenza: media della popolazione o specifica del soggetto .
Consideriamo un semplice esempio inventato relativo al tuo. Vuoi modellare il tasso di fallimento tra ragazzi e ragazze in una scuola. Come nella maggior parte delle scuole (elementari), la popolazione degli studenti è divisa in aule. Osserva una risposta binaria da bambini nelle classi (cioè risposte binarie raggruppate per classe), dove se lo studente della classe superato e se ha fallito. E se lo studente della classe è maschio e 0 altrimenti.YniN∑Ni=1niYij=1jiYij=0xij=1ji
Per introdurre la terminologia che ho usato nel primo paragrafo, puoi pensare alla scuola come alla popolazione e alle classi come materie .
Innanzitutto considera GLMM. GLMM sta adattando un modello a effetti misti. Le condizioni del modello sulla matrice del design fisso (che in questo caso comprende l'intercettazione e l'indicatore del genere) e tutti gli effetti casuali tra le classi che includiamo nel modello. Nel nostro esempio, includiamo un'intercettazione casuale, , che terrà conto delle differenze di base nel tasso di fallimento tra le classi. Quindi stiamo modellandobi
log(P(Yij=1)P(Yij=0)∣xij,bi)=β0+β1xij+bi
Il rapporto di probabilità del rischio di fallimento nel modello precedente differisce in base al valore di che è diverso tra le classi. Pertanto le stime sono specifiche per soggetto .bi
GEE, d'altra parte, sta adattando un modello marginale. Queste medie della popolazione modello . Stai modellando le aspettative solo sulla tua matrice di progettazione fissa.
log(P(Yij=1)P(Yij=0)∣xij)=β0+β1xij
Ciò è in contrasto con i modelli di effetti misti, come spiegato sopra, quali condizioni sulla matrice del design fisso e sugli effetti casuali. Quindi, con il modello marginale sopra che stai dicendo, "dimentica la differenza tra le classi, voglio solo il tasso di fallimento della popolazione (per quanto riguarda la scuola) e la sua associazione con il genere". Adatti il modello e ottieni un rapporto di probabilità che è il rapporto di probabilità medio della popolazione di fallimento associato al genere.
Quindi potresti scoprire che le tue stime dal tuo modello GEE potrebbero differire dalle tue stime dal tuo modello GLMM e questo perché non stanno stimando la stessa cosa.
(Per quanto riguarda la conversione da log-odds ratio a odds ratio esponenziando, sì, lo fai sia che si tratti di una stima a livello di popolazione o specifica del soggetto)
Alcune note / letteratura:
Per il caso lineare, la media della popolazione e le stime specifiche per soggetto sono le stesse.
Zeger, et al. 1988 ha mostrato che per la regressione logistica,
βM≈[(163√15π)2V+1]−1/2βRE
dove sono le stime marginali, sono le stime specifiche del soggetto e è la varianza degli effetti casuali.βMβREV
Molenberghs, Verbeke 2005 ha un intero capitolo sui modelli di effetti marginali e casuali.
Ho imparato questo e materiale correlato in un corso basato molto su Diggle, Heagerty, Liang, Zeger 2002 , un ottimo riferimento.