Qual è il valore " " dato nel sommario di un modello di coxph in R


18

Qual è il valore R2 dato nel sommario di un modello coxph in R? Per esempio,

Rsquare= 0.186   (max possible= 0.991 )

Ho stupidamente incluso un manoscritto come valore R2 e il revisore ci ha fatto un balzo dicendo che non era a conoscenza di un analogo della statistica R2 della regressione lineare classica in fase di sviluppo per il modello Cox e se ce n'era uno per favore fornire un riferimento. Qualsiasi aiuto sarebbe grande!


1
Nella maggior parte delle situazioni in cui il concetto di R2 si estende oltre la regressione lineare classica, è la correlazione al quadrato tra i valori osservati e quelli previsti nel modello. Potrebbe essere applicabile qui?
Macro,

2
No, non è collegato a questo.
Frank Harrell,

Risposte:


15

Usando getS3method("summary","coxph")puoi vedere come viene calcolato.

Le righe di codice pertinenti sono le seguenti:

logtest <- -2 * (cox$loglik[1] - cox$loglik[2])
rval$rsq <- c(rsq = 1 - exp(-logtest/cox$n), maxrsq = 1 - 
        exp(2 * cox$loglik[1]/cox$n))

Ecco cox$loglik"un vettore di lunghezza 2 contenente la probabilità logaritmica con i valori iniziali e con i valori finali dei coefficienti" (vedi ?coxph.object) ed cox$nè "numero di osservazioni utilizzate nell'adattamento".


5
Se non sbaglio, questo è lo pseudo R al quadrato di Cox & Snell. Per la spiegazione e il confronto di vari pseudo quadrati R, vedere ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm .
Onestop,

4

Dividendo per il numero di osservazioni nel sommario di è sbagliato, dovrebbe essere il numero di eventi senza censura; vedi O'Quigley et al. (2005) Spiegazione della casualità nei modelli di pericoli proporzionali Statistics in Medicine p. 479-489.ncoxph


4
Non corretto, dividi per il numero di osservazioni, non importa quanto strano possa sembrare. Alla domanda originale, è strano che un recensore non sia a conoscenza di qualcosa che esiste da 20 anni per il modello Cox.
Frank Harrell,

Aggiungendo allo scambio tra Ronghui Xu e @Frank Harrell, non solo `` suona strano '' dividendosi per il numero di osservazioni, ma non funziona. Per vedere questo, considera beta fissato ad un certo valore in modo tale che, approssimativamente, E (R2) = 0,5, e la stessa distribuzione di covariata, cioè tutto uguale, a parte il fatto che lo Studio 1 ha il doppio del tasso di censura rispetto allo Studio 2 Sebbene dovremmo stimare la stessa quantità di popolazione, le stime di R2 nello Studio 1 saranno circa la metà di quelle dello Studio 2, indipendentemente dalle dimensioni del campione. Invece di 0,5 avremmo circa 0,25.

R2

In risposta all'osservazione di Frank, concordo sul fatto che ciò non è semplice e che l'osservazione di Frank sulla verosimiglianza verosimile è corretta. Ho sempre visto questa quantità solo come un'approssimazione di uno stimatore coerente di una quantità di popolazione ben definita in base al guadagno di informazioni. Il documento a cui fa riferimento Ronghui Xu esegue simulazioni. Questi mostrano che l'impatto della censura, sebbene non assente, sia molto più debole quando dividiamo per il numero di fallimenti piuttosto che per il numero totale di osservazioni.

1
R2
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.