In R, sto facendo analisi dei dati di sopravvivenza dei malati di cancro.
Ho letto cose molto utili sull'analisi di sopravvivenza in CrossValidated e in altri luoghi e penso di aver capito come interpretare i risultati della regressione di Cox. Tuttavia, un risultato mi infastidisce ancora ...
Sto confrontando la sopravvivenza con il genere. Le curve di Kaplan-Meier sono chiaramente a favore delle pazienti di sesso femminile (ho verificato più volte che la legenda che ho aggiunto è corretta, la paziente con la massima sopravvivenza, 4856 giorni, è davvero una donna):
E la regressione di Cox sta tornando:
Call:
coxph(formula = survival ~ gender, data = Clinical)
n= 348, number of events= 154
coef exp(coef) se(coef) z Pr(>|z|)
gendermale -0.3707 0.6903 0.1758 -2.109 0.035 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
exp(coef) exp(-coef) lower .95 upper .95
gendermale 0.6903 1.449 0.4891 0.9742
Concordance= 0.555 (se = 0.019 )
Rsquare= 0.012 (max possible= 0.989 )
Likelihood ratio test= 4.23 on 1 df, p=0.03982
Wald test = 4.45 on 1 df, p=0.03499
Score (logrank) test = 4.5 on 1 df, p=0.03396
Quindi Hazard Ratio (HR) per pazienti maschi ( gendermale
) è 0,6903. Il modo in cui lo interpreterei (senza guardare la curva di Kaplan-Meier) è: poiché l'HR è <1, essere un paziente di genere maschile è protettivo. O più precisamente, una paziente ha una probabilità 1 / 0.6903 = exp (-coef) = 1.449 più probabilità di morire in un momento specifico rispetto a un maschio.
Ma questo non sembra quello che dicono le curve di Kaplan-Meier! Cosa c'è di sbagliato nella mia interpretazione?