In pratica, come viene calcolata la matrice di covarianza degli effetti casuali in un modello di effetti misti?


19

Fondamentalmente quello che mi chiedo è come vengono applicate le diverse strutture di covarianza e come vengono calcolati i valori all'interno di queste matrici. Funzioni come lme () ci permettono di scegliere quale struttura vorremmo, ma mi piacerebbe sapere come sono stimate.

Considera il modello lineare di effetti misti Y=Xβ+Zu+ε .

Dove u~dN(0,D) e ε~dN(0,R) . Inoltre:

Vun'r(Y|X,Z,β,u)=R

Vun'r(Y|X,β)=Z'DZ+R=V

Per semplicità assumeremo R=σ2ion .

Fondamentalmente la mia domanda è: come si stima esattamente dai dati per le varie parametrizzazioni? Supponiamo che assumiamo che D sia diagonale (gli effetti casuali sono indipendenti) o D completamente parametrizzato (caso al momento mi interessa di più) o qualcuna delle varie altre parametrizzazioni? Ci sono semplici stimatori / equazioni per questi? (Ciò sarebbe senza dubbio stimato in modo iterativo.)DDD

EDIT: Dal libro Variance Components (Searle, Casella, McCulloch 2006) sono riuscito a brillare quanto segue:

Se allora i componenti di varianza vengono aggiornati e calcolati come segue:D=σu2ioq

σu2(K+1)=u^Tu^σu2(K)tracciare(V-1ZTZ)

σe2(K+1)=Y'(Y-Xβ^(K)-Zu^(K))/n

Dove β ( k ) ed u ( k ) sono i k esimo aggiornamenti rispettivamente.β^(K)u^(K)K

Esistono formule generali quando è diagonale a blocchi o completamente parametrizzato? Immagino che, nel caso completamente parametrizzato, una decomposizione di Cholesky sia usata per garantire una positività e una simmetria positive.D


2
arxiv.org/pdf/1406.5823 (in corso di stampa sul Journal of Statistical Software ) potrebbe essere utile ...
Ben Bolker,

Risposte:


8

Goldstein .pdf @probabilityislogic collegato è un ottimo documento. Ecco un elenco di alcuni riferimenti che discutono la tua domanda particolare:

Harville, 1976: estensione del teorema di Gauss-Markov per includere la stima degli effetti casuali .

Harville, 1977: approcci della massima verosimiglianza alla stima dei componenti della varianza e ai problemi correlati .

Laird e Ware, 1982: modelli ad effetti casuali per dati longitudinali .

McCulloch, 1997: algoritmi di massima verosimiglianza per modelli misti lineari generalizzati .

L' estratto del Manuale dell'utente di SAS per la procedura MISTA contiene alcune ottime informazioni sulla stima della covarianza e molte altre fonti (a partire da pagina 3968).

Esistono numerosi libri di testo di qualità sull'analisi dei dati di misure longitudinali / ripetute, ma eccone uno che fornisce alcuni dettagli sull'implementazione in R (dagli autori di lme4e nlme):

Pinheiro e Bates, 2000: Modelli ad effetti misti in S e S-PLUS .

EDIT : un altro documento rilevante: Lindstrom e Bates, 1988: Newton-Raphson ed EM Algorithms per modelli lineari ad effetti misti per dati a misure ripetute .

EDIT 2 : E un altro: Jennrich e Schluchter, 1986: modelli di misure ripetute sbilanciate con matrici di covarianza strutturata .


Ho dato un'occhiata a Pinheiro e Bates, in particolare il capitolo 2 (sulla teoria e il calcolo) ma non mi è sembrato brillare di nulla su come la struttura della covarianza viene applicata e stimata? Lo esaminerò di nuovo a breve. Ho alcuni di quei documenti appena seduti qui, dovrò sicuramente leggerli di nuovo. Saluti.
dcl

1
@dcl Guardando indietro al capitolo 2 di P&B, vedo che potrebbero passare in rassegna alcuni dei passaggi che ti interessano (menzionano l'ottimizzazione della probabilità di log rispetto ai parametri di covarianza ma non dicono come ). Detto questo, la Sezione 2.2.8 potrebbe essere la sezione che risponde meglio alla tua domanda.

1
@dcl Aggiunta un'altra fonte che può essere d'aiuto.

grazie per i collegamenti. Ho passato in rassegna questi documenti in passato, alcuni di loro sono abbastanza tecnici per me. Ora ne farò un'altra per sfogliare, ma a prima vista non riesco a ottenere ciò che voglio da loro.
dcl

1
@dcl Ci scusiamo per il muro di collegamenti, ma la tua domanda è una che una persona può trascorrere un paio di lezioni complete discutendo (è una domanda molto buona che è un po 'spazzata sotto il tappeto quando si apprende per la prima volta sui modelli a effetti misti). Oltre a nuotare attraverso la letteratura, una cosa che potresti fare è guardare il codice sorgente lme4e vedere come gestisce questa stima.

7

Harvey Goldstein non è un brutto punto di partenza.

Come con i metodi di stima più complessi, varia con il pacchetto software. Tuttavia, spesso ciò che viene fatto è nei seguenti passaggi:

  1. DD0RR0io=1
  2. D=Dio-1R=Rio-1βuεβiouioεio
  3. β=βiou=uioε=εioDRDioRio
  4. io=io+1

Un metodo semplice e veloce è IGLS, che si basa sull'iterazione tra le procedure dei due minimi quadrati ed è descritto in dettaglio nel capitolo due. Il rovescio della medaglia è che non funziona bene per i componenti di varianza vicini allo zero.


So che questo è il metodo generale, ma come vengono stimati D e R, quali equazioni vengono utilizzate per le varie strutture? Quali sono i buoni valori iniziali? Ora controllerò il pdf, evviva.
dcl


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.