Supponiamo di avere una certa certa variabile di risposta che è stato misurato da esima sibling esima famiglia. Inoltre, alcuni dati comportamentali sono stati raccolti contemporaneamente da ciascun soggetto. Sto cercando di analizzare la situazione con il seguente modello lineare a effetti misti:
dove e sono rispettivamente l'intercetta fissa e la pendenza, è la pendenza casuale e è il residuo.
I presupposti per gli effetti casuali e residui sono (supponendo che ci siano solo due fratelli all'interno di ogni famiglia)
dove è un parametro di varianza sconosciuto e la struttura varianza-covarianza R è una matrice simmetrica 2 x 2 della forma
che modella la correlazione tra i due fratelli.
È questo un modello appropriato per uno studio simile?
I dati sono un po 'complicati. Tra le 50 famiglie, circa il 90% di esse sono gemelle dizigotiche (DZ). Per le altre famiglie,
- due hanno un solo fratello;
- due hanno una coppia DZ più un fratello; e
- due hanno una coppia DZ più due fratelli supplementari.
Credo che
lme
il pacchetto Rnlme
possa facilmente gestire (1) con situazioni mancanti o sbilanciate. Il mio problema è, come gestire (2) e (3)? Una possibilità che mi viene in mente è quella di dividere ciascuna di quelle quattro famiglie in (2) e (3) in due in modo che ogni sottofamiglia abbia uno o due fratelli in modo che il modello sopra possa ancora essere applicato. Va bene? Un'altra opzione sarebbe quella di eliminare semplicemente i dati da uno o due fratelli in più in (2) e (3), che sembra essere uno spreco. Qualche approccio migliore?Sembra che ciò
lme
permetta di fissare i valori nella matrice di varianza-covarianza residua R , ad esempio r 2 12 = 0,5. Ha senso imporre la struttura di correlazione o devo semplicemente stimarla sulla base dei dati?
lme