Come posso valutare l'adattamento del modello GEE / logistico quando alle covariate mancano alcuni dati?


9

Ho adattato due modelli di equazione di stima generalizzata (GEE) ai miei dati:

1) Modello 1: l'esito è longitudinale Sì / No variabile (A) (anno 1,2,3,4,5) con predittore continuo longitudinale (B) per anni 1,2,3,4,5.

2) Modello 2: il risultato è la stessa variabile Sì / No longitudinale (A), ma ora con il mio predittore fissato al suo valore dell'anno 1, ovvero forzato ad essere invariante nel tempo (B).

A causa della mancanza di misurazioni nel mio predittore longitudinale in alcuni punti temporali per diversi casi, il numero di punti dati nel modello 2 è superiore rispetto al modello 1.

Vorrei sapere quali confronti posso validamente fare tra i rapporti di probabilità, i valori p e l'adattamento dei due modelli, ad esempio:

  • Se l'OR del predittore B è più grande nel modello 1, posso validamente dire che l'associazione tra A e B è più forte nel modello1?

  • Come posso valutare qual è il modello migliore per i miei dati. ho ragione nel pensare che i pseudo quadrati QIC / AIC non debbano essere confrontati tra i modelli se il numero di osservazioni non è lo stesso?

Qualsiasi aiuto sarebbe molto apprezzato.


Poiché il modello 2 non è realmente considerato "nidificato" dal modello 1, non so quanto sarebbe valido utilizzare la QIC per valutare l'adattamento comparativo. Un pensiero che avevo era di usare più tecniche di imputazione per equalizzare il numero di osservazioni, e quindi si poteva probabilmente confrontare i valori QIC per quei modelli. Tuttavia, alcune pubblicazioni, ad esempio "Applied Longitudinal Data Analysis for Epidemiology" di Twisk, hanno mostrato risultati davvero incoerenti utilizzando tecniche di infarto miocardico su modelli con variabili di risposta dicotomiche. Vorrei poter aiutare di più.
Iris Tsui,

1
Perché mancano i valori? La loro mancanza è sistematica in un modo che rende i valori mancanti fondamentalmente diversi dai valori non mancanti?
Macro,

Risposte:


1

Proverei sicuramente l'imputazione multipla (ad es. Con topi o Amelia in R), possibilmente con diversi metodi alternativi per imputare i valori mancanti.

Nel peggiore dei casi, puoi considerarlo un'analisi di sensibilità.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.