Scrivere l'equazione matematica per un modello di effetti misti multilivello


15

La domanda del CV

Sto cercando di fornire una (a) rappresentazione matematica dettagliata e concisa di un modello di effetti misti. Sto usando il lme4pacchetto in R. Qual è la rappresentazione matematica corretta per il mio modello?


I dati, la domanda scientifica e il codice R.

Il mio set di dati è composto da specie in diverse regioni. Sto testando se la prevalenza di una specie cambia nel tempo che porta all'estinzione (le estinzioni non sono necessariamente permanenti; può ricolonizzare) o in seguito a una colonizzazione.

lmer(prevalence ~ time + time:type + (1 + time + type:time | reg) + (1 + time + type:time | reg:spp))

  • La prevalenza è la proporzione di strati occupati da una specie in un anno-regione
  • Il tempo è una variabile continua che indica il tempo di estinzione o colonizzazione; è sempre positivo
  • Tipo è una variabile categoriale con due livelli. Questi due livelli sono “-” e “+”. Quando type è -, è una colonizzazione (livello predefinito). Quando type è +, è un'estinzione.
  • Reg è una variabile categoriale con nove livelli, che indica la regione
  • Spp è una variabile categoriale; il numero di livelli varia tra le regioni e varia tra 48 livelli e 144 livelli.

In parole: la variabile di risposta è prevalenza (proporzione di strati occupati). Gli effetti fissi includevano 1) e intercettare, 2) il tempo dall'evento e 3) l'interazione tra il tempo all'evento e il tipo di evento (colonizzazione o estinzione). Ognuno di questi 3 effetti fissi variava casualmente tra le regioni. All'interno di una regione, ciascuno degli effetti varia in modo casuale tra le specie.

Sto cercando di capire come scrivere l'equazione matematica per il modello. Penso di capire cosa sta succedendo nel codice R (anche se, sono sicuro di avere delle lacune nella conoscenza, e spero che scrivere l'espressione matematica formale migliorerà la mia comprensione).

Ho cercato un po 'attraverso il web e attraverso questi forum. Ho trovato tonnellate di informazioni utili, per essere sicuri (e forse collegherò ad alcuni di questi in una modifica a questa domanda). Tuttavia, non sono riuscito a trovare quella "Rosetta Stone" di R-code tradotta in matematica (mi sento più a mio agio con il codice) che mi aiuterebbe davvero a confermare che ho queste equazioni giuste. In realtà, so che ci sono già alcune lacune, ma ci arriveremo.


Il mio tentativo

La forma di base di un modello di effetti misti, in notazione matriciale è (per la mia comprensione):

Y=Xβ+Zγ+ϵ

β

X=[1ΔtΔt+1ΔtnΔt+,n]
Z= [ 1 I ( r 1 ) Δ t I ( r 1 ) Δ t + I ( r 1 ) 1 I ( r 9 ) Δ t I ( r 9 ) Δ t + I ( r 9 )
β=[β0β1β2]
γ
Z=[1I(r1)ΔtI(r1)Δt+I(r1)1I(r9)ΔtI(r9)Δt+I(r9)1I(r1,n)ΔtnI(r1,n)Δt+,nI(r1,n)1I(r9,n)ΔtI(r9,n)Δt+,nI(r9,n)]
ϵN(0,Σ)
γ'=[γ0,1γ1,1γ2,1...γ0,9γ1,9γ2,9]
ϵN(0,Σ)
  • Δ t Δ t +X è la matrice di progettazione per gli effetti fissi, è il tempo dopo la colonizzazione ( ) e è il tempo dopo l'estinzione ( )ΔttimeΔt+time:type
  • Z è la matrice di progettazione per gli effetti casuali (livello 1?), I () è la funzione indicatore che fornisce 1 se il campione appartiene alla regione designata e 0 altrimenti, r è indicizzato per indicare una delle nove regioni.
  • γβ e contengono parametriγ
  • Σϵ è errori; Non sono del tutto sicuro di come spiegare , anche se mi rendo conto che una di queste matrici varianza / covarianza esprimerà covarianze tra pendenze e intercettazioni, ad es.Σ

Supponendo che le cose finora siano ~ corrette, ciò significa che sono bravo ai massimi livelli. Tuttavia, spiegare la variazione specifica della specie sui parametri, che è nidificata all'interno di ciascuna regione, mi ha lasciato di stucco ancora di più.

Ma ho preso una crepa per qualcosa che forse ha senso ...

Ciascuno dei parametri in è derivato da una combinazione lineare di predittori e parametri specifici della specie all'interno di una regione. Per ogni regione, ci sono 3 righe di, corrispondenti alle 3 variabili predittive. Ogni può essere espressa individualmente comeγγγ

  • γp,r=Up,rBp,r+ηp,r
    • dove è una matrice di progettazione specifica per la regione e il predittore , è una matrice 1 di S di parametri per la regione (ricchezza nella regione = , ad esempio 48 o 144), e è una matrice di termini di erroreUp,rrpBp,rSηp,r

In particolare, per una data regione, ciascuno dei sarebbe:γp,r

γ0,r=U0,rB0,r+η0,r
γ0,r=[1io(S1)...1io(SS)]+[B0,1B0,S]+η0,r
γ1,r=U1,rB1,r+η1,r
γ1,r=[Δtio(S1)...Δtio(SS)]+[B1,1B1,S]+η1,r
γ2,r=U2,rB2,r+η2,r
γ2,r=[Δt+I(s1)Δt+I(sS)]+[b2,1b2,S]+η2,r

Ciò sarebbe ripetuto per ogni regione. Quindi, , come . Sebbene, forse al posto di , esiste un'altra lettera, come , che viene comunemente usata.ηN(0,Ση)ϵΣG


Modifica: altri Q / A che sono stati in qualche modo utili


Dubito che questo documento abbia la "risposta" alla tua domanda, ma mi ha servito bene come primer per le equazioni del modello HMM. Dimentica che è radicato in SAS, è solo un'eccellente panoramica di questa classe di modelli. Judith Singer, utilizzando SAS Proc miscelato per adattarsi a modelli multilivello, modelli gerarchici e modelli di crescita individuali, JEBS , inverno 1998, vol. 24, n. 4, pagg. 323-355.
Mike Hunter,

1
Hai letto la sezione 2.3 qui ?
Robert Long,

Li ho letti e risorse del genere mi hanno portato così lontano. Potrebbe essere che devo solo continuare a provare, ma non sono riuscito a trovare alcun esempio che fosse abbastanza complicato da darmi sufficiente fiducia nel mio approccio attuale.
rbatt

Per quanto ho capito, "annidamento" è solo interazione nei modelli più leggeri. Questa nozione è rafforzata dall'uso della stessa sintassi. Quindi credo che reg: spp possa essere gestito da una singola variabile categoriale, e solo un altro set di blocchi in Z.
deasmhumnha

Suppongo anche che lmer eviterà la perfetta colinearità e includerà solo le interazioni non ridondanti all'interno della variabile aggiuntiva.
deasmhumnha,

Risposte:


1

Se ho capito bene il codice, perché non scrivere semplicemente qualcosa del genere

yio=(α+νj[io](α)+ηK[io](α))+(β+νj[io](β)+ηK[io](β))Tio+(δ+νj[io](δ)+ηK[io](δ))(Tio*Zio)+εio
con o, se la prima equazione è troppo lunga, qualcosa come e
[νj(α),νj(β),νj(δ)]~Multi-Normal(0,Σν)[ηj(α),ηj(β),ηj(δ)]~Multi-Normal(0,Ση)εio~Normale(0,σε)
yio=αj[io],K[io]+βj[io],K[io]Tio+δj[io],K[io](Tio*Zio)+εio
αj[io],K[io]=α+νj(α)+ηK(α)βj[io],K[io]=β+νj(β)+ηK(β)δj[io],K[io]=δ+νj(δ)+ηK(δ)
con la stessa struttura di covarianza come sopra? Mostra la struttura nidificata dei dati nonché i coefficienti che variano a seconda dei livelli.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.