Hai praticamente ragione sull'organizzazione dei dati. Se hai casi organizzati in questo modo:
ID M1 M2 M3 EVENT
Probabilmente vorrai riorganizzare i dati in modo che appaiano così:
ID TIME EVENT
1 1 0
1 2 1
1 3 1
2 1 0
2 2 0
. . .
. . .
Io chiamo questo una conversione da un formato ampio a un formato lungo. È fatto facilmente in R usando la reshape()
funzione o ancora più facilmente con il reshape2
pacchetto.
Personalmente terrei il ID
campo per il suo potenziale utilizzo nell'identificare una fonte di variazione in un modello di effetti misti. Ma questo non è necessario (come sottolineato da @BerndWeiss). Quanto segue presume che tu voglia farlo. Altrimenti, adatta un modello simile glm(...,family=binomial)
senza i termini dell'effetto casuale.
Il lme4
pacchetto in R si adatta a un modello di regressione logistica a effetti misti simile a quello di cui stai parlando, tranne con un effetto casuale o due per tenere conto della variabilità dei coefficienti tra i soggetti ( ID
). Il seguente sarebbe un codice di esempio per adattare un modello di esempio se i tuoi dati sono memorizzati in un frame di dati chiamato df
.
require(lme4)
ans <- glmer(EVENT ~ TIME + (1+TIME|ID), data=df, family=binomial)
Questo particolare modello consente ai TIME
ei intercept
coefficienti variano casualmente tra ID. In altre parole, questo è un modello misto lineare gerarchico di misure nidificate negli individui.
Una forma alternativa di un modello di cronologia di eventi a tempo discreto si divide TIME
in manichini discreti e si adatta a ciascuno come parametro. Questo è essenzialmente il caso discreto del modello Cox PH perché la curva di rischio non si limita ad essere lineare (o quadratica, o comunque si può immaginare di trasformare il tempo). Tuttavia, potresti voler raggruppare TIME
in un insieme gestibile (cioè piccolo) di periodi di tempo discreti se ce ne sono molti.
Ulteriori alternative comportano la trasformazione del tempo per ottenere la curva del pericolo corretta. Il metodo precedente sostanzialmente ti allevia dal doverlo fare, ma il metodo precedente è meno parsimonioso di questo (e il caso lineare originale che ho proposto) perché potresti avere molti punti temporali e quindi molti parametri fastidiosi.
Un eccellente riferimento su questo argomento è l' analisi dei dati longitudinali applicati di Judith Singer e John Willet : modellazione del cambiamento e occorrenza di eventi .
self-study
tag.)