Qual è la differenza tra l'output "coef" e "(exp) coef" di coxph in R?


14

Ho cercato di discernere cosa significano esattamente i risultati "coef" e "(exp) coef" di coxph. Sembra che i "(exp) coef" siano confronti della prima variabile nel modello in base al gruppo assegnato nel comando.

In che modo la funzione coxph arriva ai valori di "coef" e "(exp) coef"?

Inoltre, in che modo il coxph determina questi valori quando è coinvolta la censura?

Risposte:


21

Se si dispone di una singola variabile esplicativa, ad esempio un gruppo di trattamento, viene fornito un modello di regressione di Cox coxph(); il coefficiente ( coef) si legge come coefficiente di regressione (nel contesto del modello di Cox, di seguito descritto) e il suo esponenziale ti dà il rischio nel gruppo di trattamento (rispetto al gruppo di controllo o placebo). Ad esempio, se , il pericolo è , ovvero il 16,5%.exp(-1,80)=0,165β^=1.80exp(1.80)=0.165

Come forse saprai, la funzione di pericolo è modellata come

h(t)=h0(t)exp(βx)

dove è il rischio di base. I pericoli dipendono in modo moltiplicativo dalle covariate e è il rapporto dei pericoli tra due individui i cui valori di differiscono di un'unità quando tutte le altre covariate sono mantenute costanti. Il rapporto dei pericoli di due individui e è e viene chiamato hazard ratio (o rapporto di incidenza). Si presume che questo rapporto sia costante nel tempo, da cui il nome di rischio proporzionale .exp ( β 1 ) x 1 i j exp ( β ( x i - x j ) )h0(t)exp(β1)x1ijexp(β(xixj))

Per fare eco alla tua domanda precedente survreg, qui la forma di è specificata; più precisamente, questo è un modello semi-parametrico in quanto solo gli effetti delle covariate sono parametrizzati e non la funzione di rischio. In altre parole, non facciamo alcuna ipotesi di distribuzione sui tempi di sopravvivenza.h0(t)

I parametri di regressione sono stimati massimizzando la verosimiglianza parziale definita da

=flog(exp(βxf)r(f)exp(βxr))

dove la prima sommatoria è sopra tutti i decessi o i fallimenti , e la seconda sommazione è su tutti i soggetti ancora vivo (ma a rischio) al momento del fallimento - questo è noto come il set di rischio . In altre parole, può essere interpretato come la probabilità del profilo di registro per dopo aver eliminato (o in altre parole, la LL in cui sono state sostituite da funzioni di che massimizzano la probabilità con rispetto a per un vettore fisso ).fβ h 0 ( t ) h 0 ( t ) β h 0 ( t ) βr(f)βh0(t)h0(t)βh0(t)β

Riguardo alla censura, non è chiaro se ci si riferisca alla censura di sinistra (come potrebbe essere il caso se consideriamo un'origine per la scala temporale precedente al momento in cui è iniziata l'osservazione, chiamata anche entrata ritardata ) o censura di destra. In ogni caso, ulteriori dettagli sul calcolo dei coefficienti di regressione e su come il pacchetto di sopravvivenza gestisce la censura possono essere trovati in Therneau e Grambsch, Modeling Survival Data (Springer, 2000). Terry Therneau è l'autore del precedente pacchetto S. È disponibile un tutorial online .

L'analisi di sopravvivenza in R , di David Diez, fornisce una buona introduzione all'analisi di sopravvivenza in R. Una breve panoramica dei test per i parametri di regressione è riportata a p. 10. Si spera che ciò contribuisca a chiarire l'aiuto in linea citato da @onestop , "coefficienti i coefficienti del predittore lineare, che moltiplicano le colonne della matrice del modello". Per un libro di testo applicato, raccomando di analizzare i dati medici usando S-PLUS , di Everitt e Rabe-Hesketh (Springer, 2001, cap. 16 e 17), da cui proviene la maggior parte di quanto sopra. Un altro riferimento utile è l'appendice di John Fox sulla regressione proporzionale dei rischi di Cox per i dati di sopravvivenza .χ2


4
+1, questa è una risposta davvero istruttiva a una domanda piuttosto semplice e diretta. Apprezzo in particolare i collegamenti alle risorse per ulteriori informazioni. NB il link al tutorial online di Terry Therneau è morto; Un pacchetto per l'analisi della sopravvivenza in S può essere un collegamento attivo allo stesso materiale.
gung - Ripristina Monica

5

Per citare la documentazione per il metodo di stampa per un oggetto coxph, ottenuta in R digitando ?survival::print.coxph:

coefficients i coefficienti del predittore lineare, che moltiplicano le colonne della matrice del modello.

Questa è tutta la documentazione fornita dall'autore del pacchetto. Il pacchetto non contiene alcuna guida per l'utente o vignetta del pacchetto. R non è progettato per essere intuitivo e la documentazione presuppone che abbiate già compreso i metodi statistici coinvolti.

Suppongo che la coefcolonna dia quanto sopra coefficients, e la exp(coef)colonna è esponenziale di questi. Poiché la regressione di Cox comporta una funzione log link, i coefficienti sono i rapporti di rischio log . Esponendoli quindi ti restituisce rapporti di rischio.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.