Come valutare la bontà dell'adattamento per le funzioni di sopravvivenza


9

Sono un nuovo arrivato nell'analisi di sopravvivenza, anche se ho una certa conoscenza della classificazione e della regressione.

Per regressione, abbiamo statistiche MSE e R quadrate. Ma come possiamo dire che il modello di sopravvivenza A è superiore al modello di sopravvivenza B oltre a qualche tipo di grafici (curva KM)?

Se possibile, spiega la differenza con un esempio (ad es. Pacchetto rpart in R). Come puoi dimostrare che un albero di sopravvivenza CART è migliore di un altro albero di sopravvivenza CART? Quali metriche possono essere utilizzate?


3
Esistono vari tipi di analisi di sopravvivenza. Alcuni di essi sono effettivamente basati sulla regressione. Alcuni di essi, come il KM, potrebbero essere più facilmente considerati stimatori per le statistiche relative alla sopravvivenza.
Alexis,

Grazie per i tuoi continui sforzi per migliorare la tua domanda. Ho il sospetto che sia responsabile / appropriato per CV ora. L'ho nominato per la riapertura. Vedremo se gli altri sono d'accordo. Potrebbe essere utile pubblicare due modelli di sopravvivenza di tipo CART che le persone possano utilizzare per spiegare questi problemi.
gung - Ripristina Monica

1
Ben, quindi sostanzialmente stai dicendo che in una regressione proporzionale del rischio di Cox non esiste (finora) un buon modo per valutare la bontà dell'adattamento? R-Square non porta a buoni risultati perché non è in grado di gestire correttamente le osservazioni censurate e le osservazioni non censurate? Stai parlando di Harrells c, ti ho capito bene che il metodo non è applicabile a una regressione di Cox-PH?
Kosta S.

Risposte:


9

R2(descritto in un'altra risposta) è che dipende molto dalla distribuzione della censura dei dati. Anche altre cose naturali che potresti osservare, come il rapporto di verosimiglianza con il modello nullo, presentano questo problema. (Ciò è fondamentalmente perché il contributo di un datapoint censurato alla probabilità è molto diverso dal contributo di un datapoint in cui si osserva l'evento, perché uno di essi proviene da un PDF e uno da un CDF.) Vari ricercatori hanno modi proposti per aggirare questo, ma quelli che ho visto di solito richiedono che tu abbia un modello di distribuzione della censura o qualcosa di altrettanto poco pratico. Non ho esaminato quanto male sia in pratica questa dipendenza, quindi se la tua censura è abbastanza mite, potresti ancora esaminare le statistiche basate sul rapporto di verosimiglianza. Per i modelli CART di sopravvivenza,

τè anche meno sensibile delle statistiche di cui sopra, quindi potresti non voler scegliere tra modelli basati su di essa se la differenza tra loro è piccola; è più utile come indice interpretabile delle prestazioni generali che come modo di confrontare diversi modelli.

(Infine, ovviamente se hai in mente uno scopo specifico per i modelli, ovvero se sai qual è la tua funzione di perdita delle previsioni, puoi sempre valutarle in base alla funzione di perdita! Ma ti sto indovinando ' non sei così fortunato ...)

Per una discussione più approfondita di entrambe le statistiche del rapporto di verosimiglianza e di Harrell c , si dovrebbe guardare eccellente libro di testo di Harrell Regressione Modeling Strategie . La sezione sulla valutazione dei modelli di sopravvivenza è §19.10, pagg. 492-493. Mi dispiace di non poterti dare una sola risposta definitiva, ma non credo sia un problema risolto!


5

Le regressioni di rischi proporzionali di Cox per i dati di sopravvivenza possono essere pensate come corrispondenti alle regressioni standard sotto molti aspetti. Ad esempio, le regressioni di Cox forniscono anche errori standard residui e statistiche R-square. Vedi la coxphfunzione nel survivalpacchetto R. (Puoi pensare alle curve KM come corrispondenti ad analisi non parametriche nelle statistiche standard. Come incorporeresti un test non parametrico in CART?) In pratica con i dati clinici, gli errori standard residui tendono ad essere alti e i valori del quadrato R bassi nella regressione di Cox.

Pertanto le regressioni standard e le regressioni di Cox hanno requisiti e limitazioni simili. Devi verificare che i dati si adattino alle ipotesi sottostanti, che nell'analisi di Cox include inoltre l'assunto che i pericoli confrontati sono proporzionali nel tempo. Dovrai comunque evitare un eccesso di adattamento e dovrai convalidare il tuo modello. E poiché capisco CART, anche se non lo uso da solo, dovrai comunque affrontare le difficoltà poste dal confronto di modelli non nidificati.


Grazie per la risposta sulla differenza e le relazioni tra regressione di Cox e regressione. Ma voglio sapere come confrontare due modelli di sopravvivenza dell'albero delle decisioni di due parti (CART).
Inondazioni

Il documento ad accesso aperto collegato a projecteuclid.org/euclid.ssu/1315833185 è una revisione e un confronto abbastanza recenti dei metodi per la costruzione e la scelta di alberi di sopravvivenza, basati su rparte altri pacchetti R e codice.
EdM

Grazie per aver puntato il foglio. Leggerò il documento adesso.
Inondazioni
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.