Matrice varianza-covarianza in lmer


18

So che uno dei vantaggi dei modelli misti è che consentono di specificare la matrice varianza-covarianza per i dati (simmetria composta, autoregressiva, non strutturata, ecc.) Tuttavia, la lmerfunzione in R non consente di specificare facilmente questa matrice. Qualcuno sa quale struttura lmerutilizza per impostazione predefinita e perché non è possibile specificarla facilmente?

Risposte:


9

I modelli misti sono (versioni generalizzate di) modelli di componenti di varianza. Annoti la parte degli effetti fissi, aggiungi termini di errore che potrebbero essere comuni per alcuni gruppi di osservazioni, aggiungi la funzione di collegamento se necessario, e la metti in un massimizzatore di probabilità.

Le varie strutture di varianza che stai descrivendo, tuttavia, sono i modelli di correlazione di lavoro per le equazioni di stima generalizzate, che compromettono parte della flessibilità dei modelli misti / multilivello per la robustezza dell'inferenza. Con GEE, sei interessato solo a condurre un'inferenza sulla parte fissa e sei d'accordo nel non stimare i componenti della varianza, come faresti in un modello misto. Per questi effetti fissi, ottieni una stima robusta / sandwich che è appropriata anche quando la tua struttura di correlazione è errata. Tuttavia, l'inferenza per il modello misto si interromperà se il modello non viene specificato correttamente.

Quindi, pur avendo molto in comune (una struttura multilivello e capacità di affrontare le correlazioni residue), i modelli misti e GEE sono ancora procedure piuttosto distinte. Il pacchetto R che si occupa di GEE viene chiamato in modo appropriato geee nell'elenco dei possibili valori corstrdell'opzione troverai le strutture che hai citato.

Dal punto di vista di GEE, lmer funziona con correlazioni intercambiabili ... almeno quando il modello ha due livelli di gerarchia e vengono specificate solo intercettazioni casuali.


Grazie Stas. Non ho mai sentito parlare di GEE prima e sto solo cercando di imparare la modellazione mista (che è difficile e è anche amplificata dalle differenze nell'implementazione del software). Proverò GEE. Ho davvero un semplice esperimento con misure ripetute con misure biomediche dipendenti. Sono interessato principalmente alla parte fissa. La mia formazione precedente riguarda principalmente ANOVA con effetti fissi standard, quindi potrebbe essere una transizione più semplice.
Nikita Kuznetsov,

Mi piace l'idea di stimare i parametri fissi e ho provato la libreria gee. Ci sono anche altre librerie (ad esempio Geepack). Sono peggio per qualche motivo? Nel mio campo le persone hanno bisogno di riportare valori p. C'è un modo per ottenerli dalle stime e condurre anche confronti a coppie tenendo conto del clustering?
Nikita Kuznetsov,

Confronti a coppie di cosa? La varietà di librerie R mi ha sempre fatto impazzire e non faccio ricerche sulle differenze tra i pacchetti a meno che non abbia una reale necessità di lavorare su un modello specifico.
Attacco

StatsK, è davvero corretto? Sono un principiante nella modellazione multilivello ma Hox (2010) o Rabe-Hesketh & Skrondal (2013) distinguono chiaramente tra diversi stimatori di varianza tramite MLE e GEE. Ad esempio, quando si calcola un errore sandwich standard "robusto", Hox (p. 260) afferma che è possibile calcolarli tramite la modellazione multilivello utilizzando la matrice Informazioni / inversa della matrice Assia (tenendo conto della struttura multilivello) o stimando la varianza da residui grezzi e uso successivo di GLS per calcolare i coefficienti (approccio GEE)
Arne Jonas Warnke,

1
Non sono sicuro che la distinzione suggerita da StasK sia davvero corretta qui. Mentre queste strutture di correlazione alternative sono effettivamente utilizzate dai GEE, è perfettamente possibile adattare modelli misti (completamente parametrici) con strutture più complicate per la covarianza di effetti casuali o errori residui, e il pacchetto nlme in R, SAS Proc Mixed, o I comandi misti di Stata lo fanno.
Jonathan Bartlett,

4

Il ramo FlexLamba di lmer offre tale funzionalità.

Vedi https://github.com/lme4/lme4/issues/224 per esempi su come implementare una struttura specifica di errori o effetti casuali.


Posso installare contemporaneamente sia le filiali regolari che FlexLambda ?. Come?
skan

3

Per quanto ne so, lmer non sta avendo un modo "semplice" per affrontare questo problema. Inoltre, dato che nella maggior parte dei casi lmer fa un uso pesante di matrici sparse per la fattorizzazione di Cholesky, trovo improbabile che consenta VCV totalmente non strutturati.

(1|Run'ndEff1)+(1|Run'ndEff2)

R=[σRE12000000σRE12000000σRE12000000σRE22000000σRE22000000σRE22]

Tuttavia, con LME non tutto è perduto: è possibile specificare questi attributi della matrice VCV "facilmente" se si utilizza il pacchetto R MCMCglmm. Guarda il CourseNotes.pdf , p.70. In quella pagina fornisce alcuni analoghi su come sarebbe definita la struttura degli effetti casuali di lme4 ma, come vedrai, lmer è meno flessibile di MCMCglmm in questa materia.

A metà strada c'è il problema delle classi lme corStruct di nlme, ad es. corCompSymm , corAR1 , ecc. ecc. La risposta di Fabian in questo battistrada fornisce alcuni esempi più concisi per le specifiche VCV basate su lme4 ma, come detto prima, non sono così esplicite come quelle in MCMCglmm o nlme.


Non "mi fido" di MCMCglmm, a causa della scelta ingenua delle precedenti distribuzioni.
Stéphane Laurent,

A. Non penso che sia "ingenuo"; possono riflettere ipotesi valide. Puoi anche definire priori impropri se lo senti fortemente per qualcosa. B. Questa era solo una parte della mia risposta, non diceva che fosse l'unica strada da percorrere; Ho dato un esempio per lme4. C. Se hai bisogno di fare effetti misti multivariati, è praticamente l'unico pacchetto disponibile insieme a sabreR ...
usεr11852 dice Reinstate Monic,

Spiacenti, il mio commento non è stato una critica alla tua risposta. Nel dire "priori ingenui", ho parlato dei priori non informativi.
Stéphane Laurent,

Non sembra probabile che questa matrice R sia corretta. Anche le "classiche" misure ripetute ANOVA consentono correlazioni diverse da zero tra le condizioni (sto pensando alla matrice di simmetria composta). Mi sembra che questa matrice sarebbe valida solo per un progetto tra soggetti con assegnazione casuale con due cluster.
Nikita Kuznetsov,

La matrice è "giusta"; dato che in effetti ho definito due cluster come:(1|Run'ndEff1)+(1|Run'ndEff2), ha senso. Chiaramente non codifica alcuna simmetria composta nella dinamica della varianza.
usεr11852 dice Reinstate Monic il
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.