Scelta dei pesi dei percorsi nei modelli concettuali SEM per gemelli identici e fraterni usando openMx


10

Sto esaminando il pacchetto R OpenMx per un'analisi epidemiologica genetica al fine di imparare a specificare e adattare i modelli SEM. Sono nuovo in questo, quindi abbi pazienza. Sto seguendo l'esempio a pagina 59 della Guida dell'utente di OpenMx . Qui disegnano il seguente modello concettuale:

Modelli SEM per gemelli identici e fraterni

E nel specificare i percorsi, impostano il peso del nodo "uno" latente sui nodi bmi manifestati "T1" e "T2" su 0,6 perché:

I principali percorsi di interesse sono quelli da ciascuna delle variabili latenti alla rispettiva variabile osservata. Anche questi sono stimati (quindi tutti sono liberi), ottengono un valore iniziale di 0,6 e etichette appropriate.

# path coefficients for twin 1
mxPath(
  from=c("A1","C1","E1"),
  to="bmi1",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

# path coefficients for twin 2
mxPath(
  from=c("A2","C2","E2"),
  to="bmi2",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

Il valore di 0,6 deriva dalla covarianza stimata di bmi1e bmi2(di coppie gemelle zigotiche rigorosamente mono ). Ho due domande:

  1. Quando dicono che al percorso viene assegnato un valore "iniziale" di 0,6 è come impostare una routine di integrazione numerica con valori iniziali, come nella stima dei GLM?

  2. Perché questo valore è stimato rigorosamente dai gemelli monozigoti?

Risposte:


4

Per rispondere ai tuoi 2 punti:

1) Sì, esattamente - il valore iniziale è semplicemente dettando dove l'algoritmo inizierà il processo di ottimizzazione. La maggior parte dei pacchetti software in realtà determina il proprio valore iniziale per impostazione predefinita e l'utente deve provare a inserire valori diversi solo quando si verificano problemi durante la stima. Dalla mia esperienza, i valori iniziali più plausibili andranno bene e non cambieranno il modello finale su cui converge l'algoritmo.

2) Il valore 0.6 è il valore iniziale non per l'intercetta di T1 e T2 (percorso tra "uno" e T1 & T2), ma è invece il valore iniziale per i caricamenti dei fattori che collegano ciascuna variabile latente (A, C, E ) al loro indicatore T1 o T2. Ciò è indicato dal fatto che il percorso va from=c("A1","C1","E1"), to="bmi1"nel primo caso e from=c("A2","C2","E2"), to="bmi2"nel secondo caso.

Per quanto riguarda il valore specifico "0.6": non sono riuscito a trovare nella documentazione in cui menzionano il prendere questo valore in base al sottogruppo di gemelli monozigoti; e in realtà, queste stime dei parametri (caricamenti dei fattori per le 3 variabili latenti) non possono essere calcolate direttamente dal campione, poiché per definizione queste variabili latenti non sono osservate (sono latenti). Come accennato al punto 1, raramente la scelta tra due valori plausibili influirà sulle stime dei parametri del modello convergente, quindi la mia ipotesi è che abbiano semplicemente scelto uno dei tanti valori plausibili per questi caricamenti di fattori come valori iniziali. Se questo valore provenga dalla covarianza stimata tra bmi1 e bmi2 solo nel sottogruppo monozigote-gemello dovrebbe essere irrilevante, poiché eventuali valori iniziali plausibili dovrebbero indurre l'algoritmo a convergere sugli stessi valori finali, forse con alcune differenze nei tempi di calcolo. (E il mio consiglio per convincerti è: provalo! Prova diversi valori iniziali e confronta le stime dei parametri dei modelli convergenti.)

Come nota generale, sottolineo che la scelta dei valori iniziali per qualsiasi stima di parametro diventa MOLTO importante se l'argomento freeè impostato su FALSE, perché il valore iniziale diventerà effettivamente il valore della stima del parametro nel modello finale (non lo farà essere stimato; è fissato prima della stima).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.