Quando utilizzare equazioni di stima generalizzate rispetto a modelli di effetti misti?


63

Da un po 'di tempo uso felicemente modelli di effetti misti con dati longitudinali. Vorrei poter inserire le relazioni AR in lmer (penso di aver ragione nel non poterlo fare?) Ma non penso che sia disperatamente importante, quindi non mi preoccupo troppo.

Ho appena incontrato equazioni di stima generalizzate (GEE) e sembrano offrire molta più flessibilità rispetto ai modelli ME.

A rischio di porre una domanda troppo generica, c'è qualche consiglio su quale sia il migliore per compiti diversi? Ho visto alcuni articoli confrontarli e tendono ad essere nella forma:

"In questa area altamente specializzata, non usare GEE per X, non usare modelli ME per Y".

Non ho trovato consigli più generali. Qualcuno può illuminarmi?

Grazie!


1
"sembrano offrire molta più flessibilità" ... Beh, differiscono anche nel loro approccio poiché i GEE sono usati per adattarsi a una distribuzione marginale, contrariamente all'approccio condizionale spesso di interesse quando si usa GLMM.
chl


Si noti che glmmPQLpuò adattarsi anche alle strutture di correlazione AR
Tom Wenseleers,


@incodeveritas Struttura di covarianza autoregressiva
Tommyixi,

Risposte:


56

jiYij

log(pij1pij)=μ+ηi

ηiN(0,σ2)ipij=P(Yij=1|ηi)

μ

Se si utilizza GEE su questi dati, si stimerebbero le probabilità di log medie della popolazione. In questo caso sarebbe

ν=log(Eη(11+eμηi)1Eη(11+eμηi))

νμμ=1σ2=1ν.83

Modifica: in generale, un modello di effetti misti senza predittori può essere scritto come

ψ(E(Yij|ηi))=μ+ηi

ψ

ψ(Eη(ψ1(E(Yij|ηi))))Eη(E(Yij|ηi))

ψ(x)=x

Modifica 2: Vale anche la pena notare che gli errori "robusti" di tipo sandwich prodotti da un modello GEE forniscono intervalli di confidenza asintotici validi (ad es. In realtà coprono il 95% delle volte) anche se la struttura di correlazione specificata nel modello non è corretta.

Modifica 3: se il tuo interesse è comprendere la struttura delle associazioni nei dati, le stime GEE delle associazioni sono notoriamente inefficienti (e talvolta incoerenti). Ho visto un riferimento per questo, ma non riesco a posizionarlo in questo momento.


3
(+1) Circa la tua seconda modifica, aggiungerei che gli stimatori di varianza basati sul modello funzioneranno meglio con un piccolo numero di cluster (o possiamo usare uno stimatore di Jacknife). Per quanto riguarda un riferimento, rimando sempre a gbi.agrsci.dk/statistics/courses/phd07/material/Day10 , che contiene note molto belle sulle lezioni (sfondo statistico, incluso un confronto di approcci GEE vs. GLMM + illustrazioni in R) .
chl

Caspita, che bella risposta. Grazie mille. Questo è assolutamente quello che stavo cercando. E grazie anche a chl per il link. +10 internet per entrambi.
Chris Beeley,

I GEE non assumono anche che gli effetti di livello superiore siano parametri fastidiosi? Mi sembra che sia un'altra importante distinzione: se uno è interessato a quegli effetti, GEE non te lo darebbe. In alternativa, se non ti senti a tuo agio nel fare tali assunzioni distributive, forse GEE sarebbe preferibile.
robin.datadrivers

Il link che @chl ha fornito è morto: / (sei anni dopo è un po 'previsto, giusto?)
Guilherme Marthe,

@GuilhermeMarthe Buona cattura! Sfortunatamente, ho collegato lo stesso materiale in un altro thread . Vedo due opzioni: fare riferimento al pacchetto Geepack R (sviluppato dagli stessi due autori) o utilizzare la WayBack Machine per il momento.
chl

10

GEE secondo me è molto utile quando non stiamo usando la modellazione bayesiana e quando non è disponibile una soluzione di piena verosimiglianza. Inoltre, GEE potrebbe richiedere campioni di dimensioni maggiori per essere sufficientemente precisi, ed è molto poco robusto per i dati longitudinali non casualmente mancanti. GEE presume che manchi completamente a caso mentre i metodi di probabilità (modelli di effetti misti o minimi quadrati generalizzati, per esempio) presuppongono che manchi solo a caso.


1

Puoi trovare una discussione approfondita ed esempi concreti in Fitzmaurice, Laird and Ware, Applied Longitudinal Analysis , John Wiley & Sons, 2011, 2a edizione, Capitoli 11-16.

Per quanto riguarda gli esempi, è possibile trovare set di dati e programmi SAS / Stata / R nel sito Web associato .


2
Potresti riassumere i punti principali di questo libro?
chl

2
Direi che Macro lo ha già fatto ;-) Nel libro puoi trovare discussioni più lunghe e dettagliate, alcuni esempi analitici, numerici e grafici e alcuni altri punti, tra cui quello che ha aggiunto Frank Harrell. Puoi anche guardare il blog di Gelman .
Sergio,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.