Se si dispone di una singola variabile esplicativa, ad esempio un gruppo di trattamento, viene fornito un modello di regressione di Cox coxph()
; il coefficiente ( coef
) si legge come coefficiente di regressione (nel contesto del modello di Cox, di seguito descritto) e il suo esponenziale ti dà il rischio nel gruppo di trattamento (rispetto al gruppo di controllo o placebo). Ad esempio, se , il pericolo è , ovvero il 16,5%.exp(-1,80)=0,165β^= - 1,80exp( - 1,80 ) = 0,165
Come forse saprai, la funzione di pericolo è modellata come
h(t)=h0(t)exp(β′x)
dove è il rischio di base. I pericoli dipendono in modo moltiplicativo dalle covariate e è il rapporto dei pericoli tra due individui i cui valori di differiscono di un'unità quando tutte le altre covariate sono mantenute costanti. Il rapporto dei pericoli di due individui e è e viene chiamato hazard ratio (o rapporto di incidenza). Si presume che questo rapporto sia costante nel tempo, da cui il nome di rischio proporzionale .exp ( β 1 ) x 1 i j exp ( β ′ ( x i - x j ) )h0(t)exp(β1)x1ijexp(β′(xi−xj))
Per fare eco alla tua domanda precedente survreg
, qui la forma di è specificata; più precisamente, questo è un modello semi-parametrico in quanto solo gli effetti delle covariate sono parametrizzati e non la funzione di rischio. In altre parole, non facciamo alcuna ipotesi di distribuzione sui tempi di sopravvivenza.h0(t)
I parametri di regressione sono stimati massimizzando la verosimiglianza parziale definita da
ℓ=∑flog(exp(β′xf)∑r(f)exp(β′xr))
dove la prima sommatoria è sopra tutti i decessi o i fallimenti , e la seconda sommazione è su tutti i soggetti ancora vivo (ma a rischio) al momento del fallimento - questo è noto come il set di rischio . In altre parole, può essere interpretato come la probabilità del profilo di registro per dopo aver eliminato (o in altre parole, la LL in cui sono state sostituite da funzioni di che massimizzano la probabilità con rispetto a per un vettore fisso ).fℓ β h 0 ( t ) h 0 ( t ) β h 0 ( t ) βr(f)ℓβh0(t)h0(t)βh0(t)β
Riguardo alla censura, non è chiaro se ci si riferisca alla censura di sinistra (come potrebbe essere il caso se consideriamo un'origine per la scala temporale precedente al momento in cui è iniziata l'osservazione, chiamata anche entrata ritardata ) o censura di destra. In ogni caso, ulteriori dettagli sul calcolo dei coefficienti di regressione e su come il pacchetto di sopravvivenza gestisce la censura possono essere trovati in Therneau e Grambsch, Modeling Survival Data (Springer, 2000). Terry Therneau è l'autore del precedente pacchetto S. È disponibile un tutorial online .
L'analisi di sopravvivenza in R , di David Diez, fornisce una buona introduzione all'analisi di sopravvivenza in R. Una breve panoramica dei test per i parametri di regressione è riportata a p. 10. Si spera che ciò contribuisca a chiarire l'aiuto in linea citato da @onestop , "coefficienti i coefficienti del predittore lineare, che moltiplicano le colonne della matrice del modello". Per un libro di testo applicato, raccomando di analizzare i dati medici usando S-PLUS , di Everitt e Rabe-Hesketh (Springer, 2001, cap. 16 e 17), da cui proviene la maggior parte di quanto sopra. Un altro riferimento utile è l'appendice di John Fox sulla regressione proporzionale dei rischi di Cox per i dati di sopravvivenza .χ2