Modello di effetti casuali che gestisce ridondanze


9

Sto provando a trattare un'analisi del tempo per l'evento usando ripetuti risultati binari. Supponiamo che il tempo per l'evento sia misurato in giorni ma per il momento discretizziamo il tempo o le settimane. Voglio approssimare uno stimatore di Kaplan-Meier (ma consentire le covariate) usando risultati binari ripetuti. Sembrerà una strada rotonda da percorrere ma sto esplorando come ciò si estenda ai risultati ordinali e agli eventi ricorrenti.

Se crei una sequenza binaria che assomiglia a 000 per qualcuno censurato a 3 settimane, 0000 per qualcuno censurato a 4w e 0000111111111111 .... per un soggetto che ha fallito a 5w (gli 1 si estendono al punto in cui si trovava l'ultimo soggetto seguito nello studio), quando si calcolano proporzioni specifiche di una settimana di 1 secondo, è possibile ottenere incidenze cumulative ordinarie (fino a quando non si arriva a tempi di censura variabili, dove questo si avvicina solo ma non equivale alle stime di incidenza cumulative di Kaplan-Meier).

Posso adattare le osservazioni binarie ripetute con un modello logistico binario usando GEE, invece di rendere il tempo discreto come sopra ma invece usando una spline nel tempo. Lo stimatore di covarianza a sandwich di cluster funziona abbastanza bene. Ma vorrei ottenere un'inferenza più esatta usando un modello di effetti misti. Il problema è che gli 1 dopo il primo 1 sono ridondanti. Qualcuno conosce un modo per specificare effetti casuali o per specificare un modello che tenga conto dei licenziamenti in modo che gli errori standard non vengano eliminati?

Si noti che questa configurazione differisce da quella di Efron perché utilizzava modelli logistici per stimare le probabilità condizionali nelle serie di rischi. Sto stimando le probabilità incondizionate.

Risposte:


3

Per quanto posso vedere sia con il GEE che con un modello misto per ripetute osservazioni binarie, avrai il problema che il modello assegnerà una probabilità positiva per uno '0' dopo che è stato osservato il primo '1'.

In ogni caso, dato che si desidera ottenere stime da una regressione logistica a effetti misti che avrà la stessa interpretazione del GEE (vedere qui per ulteriori informazioni), è possibile adattare il modello utilizzando la mixed_model()funzione dal pacchetto GLMMadaptive , quindi usare marginal_coefs(). Per un esempio, vedi qui .


1
Grazie Dimitris. Nel mio caso con 1 ridondante (per ottenere la funzione media corretta) penso che avrò bisogno di un modello modificato o di una strana configurazione di effetti casuali. Il GLMMadaptivepacchetto sembra eccezionale per l'installazione più generale.
Frank Harrell,

2

Paio di pensieri su questo:

  1. Sembra che un modello a effetti misti sia fondamentalmente un modello di probabilità "condizionale", cioè qual è la probabilità di un evento per un soggetto a rischio per quell'evento.

  2. Sappiamo che la probabilità di un '1' dopo che il primo '1' è uno. Pertanto, non vi sono ulteriori informazioni nei valori "1" successivi.

  3. Sembra che, poiché i successivi valori "1" non contengono ulteriori informazioni, non dovrebbero avere alcun impatto sulla funzione di probabilità e quindi non avere alcun impatto sugli errori standard degli stimatori basati sulla probabilità, né sulle stime stesse. In effetti, non ci sarebbe alcun impatto sui successivi valori '1' se p (y = '1' | x) = 1 indipendentemente dai valori dei parametri del modello, come dovrebbe essere.

  4. Potremmo essere in grado di forzare questo comportamento (cioè, p (y = '1' | x) = 1) e mantenere la funzione media desiderata, aggiungendo un indicatore covariata al modello che segna quelli successivi e forzando il suo coefficiente essere molto grande in modo che effettivamente p (y = '1' | x) = 1.

  5. Come hai detto, potrebbe esserci anche un modo per forzare la prima "1" e le risposte successive ad avere una correlazione del 100%. Ma in un modello binomiale, è uguale a p (y = '1' | x) = 1 per le risposte successive.


1
Grazie Matt. Se non volevo un modello completo ma ero soddisfatto delle equazioni di stima, quello che stai ottenendo è l'aggiunta di risposte duplicate alla funzione punteggio per ottenere la funzione media corretta, ma non aggiungerle alla funzione informazioni. Non credo di poter aggiungere un indicatore di covariata, perché ciò richiederebbe, ad esempio, l'effetto del trattamento. Penso al modello a effetti misti piuttosto che a un modello incondizionato. Quando l'evento non è uno stato di assorbimento, stai modellando gli effetti marginali in modo dipendente dal tempo.
Frank Harrell,

1

Non sono esattamente sicuro di cosa stai cercando di fare, ma puoi adattare un modello di regressione logistica in pool ( https://www.ncbi.nlm.nih.gov/pubmed/2281238 )? In questo caso includeresti 1 solo durante l'intervallo dell'evento terminale - non si ripeterebbe dopo che si è verificato l'evento. Includeresti il ​​tempo nel modello in modo flessibile (ad esempio, espanso usando le spline).


1
Ehi Bryan - Mi piace molto la regressione logistica aggregata e l'ho usata spesso. Ma se si terminano le osservazioni di un soggetto all'evento terminale e si hanno altri soggetti seguiti oltre quel punto senza un evento, si otterrà la funzione media (P (evento per tempo t)) errata. Voglio ottenere stime di incidenza cumulative vicino a Kaplan-Meier per la funzione media almeno in casi speciali.
Frank Harrell,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.