Hai praticamente ragione sull'organizzazione dei dati. Se hai casi organizzati in questo modo:
ID M1 M2 M3 EVENT
Probabilmente vorrai riorganizzare i dati in modo che appaiano così:
ID TIME EVENT
1 1 0
1 2 1
1 3 1
2 1 0
2 2 0
. . .
. . .
Io chiamo questo una conversione da un formato ampio a un formato lungo. È fatto facilmente in R usando la reshape()funzione o ancora più facilmente con il reshape2pacchetto.
Personalmente terrei il IDcampo per il suo potenziale utilizzo nell'identificare una fonte di variazione in un modello di effetti misti. Ma questo non è necessario (come sottolineato da @BerndWeiss). Quanto segue presume che tu voglia farlo. Altrimenti, adatta un modello simile glm(...,family=binomial)senza i termini dell'effetto casuale.
Il lme4pacchetto in R si adatta a un modello di regressione logistica a effetti misti simile a quello di cui stai parlando, tranne con un effetto casuale o due per tenere conto della variabilità dei coefficienti tra i soggetti ( ID). Il seguente sarebbe un codice di esempio per adattare un modello di esempio se i tuoi dati sono memorizzati in un frame di dati chiamato df.
require(lme4)
ans <- glmer(EVENT ~ TIME + (1+TIME|ID), data=df, family=binomial)
Questo particolare modello consente ai TIMEei interceptcoefficienti variano casualmente tra ID. In altre parole, questo è un modello misto lineare gerarchico di misure nidificate negli individui.
Una forma alternativa di un modello di cronologia di eventi a tempo discreto si divide TIMEin manichini discreti e si adatta a ciascuno come parametro. Questo è essenzialmente il caso discreto del modello Cox PH perché la curva di rischio non si limita ad essere lineare (o quadratica, o comunque si può immaginare di trasformare il tempo). Tuttavia, potresti voler raggruppare TIMEin un insieme gestibile (cioè piccolo) di periodi di tempo discreti se ce ne sono molti.
Ulteriori alternative comportano la trasformazione del tempo per ottenere la curva del pericolo corretta. Il metodo precedente sostanzialmente ti allevia dal doverlo fare, ma il metodo precedente è meno parsimonioso di questo (e il caso lineare originale che ho proposto) perché potresti avere molti punti temporali e quindi molti parametri fastidiosi.
Un eccellente riferimento su questo argomento è l' analisi dei dati longitudinali applicati di Judith Singer e John Willet : modellazione del cambiamento e occorrenza di eventi .
self-studytag.)