Regressione e scala temporale di Cox


9

La variabile X (hazard) nell'analisi di regressione proporzionale del rischio Cox deve sempre essere il tempo? In caso contrario, potresti fornire un esempio, per favore?

L'età del malato di cancro può essere una variabile di rischio? In tal caso, può essere interpretato come il rischio di ammalarsi di cancro a una certa età? La regressione di Cox sarebbe un'analisi legittima per studiare l'associazione tra espressione genica ed età?

Risposte:


8

Di solito, l'età al basale viene utilizzata come covariata (perché è spesso associata a malattia / morte), ma può essere utilizzata anche come scala temporale (penso che sia usata in alcuni studi longitudinali, perché è necessario avere abbastanza persone a rischio lungo la scala temporale, ma in realtà non ricordo - ho appena trovato queste diapositive sull'analisi degli studi di coorte assumendo una scala temporale continua che parla di studi di coorte). Nell'interpretazione, è necessario sostituire il tempo dell'evento per età e si potrebbe includere l'età alla diagnosi come covariata. Ciò avrebbe senso quando studi la mortalità specifica per età di una particolare malattia (come illustrato in queste diapositive ).

Forse questo articolo è interessante poiché contrappone i due approcci, tempo di studio rispetto all'età cronologica: scale temporali nel modello di Cox: effetto della variabilità tra le età di entrata sulle stime dei coefficienti . Ecco un altro documento:

Cheung, YB, Gao, F e Khoo, KS (2003). Età alla diagnosi e scelta dei metodi di analisi della sopravvivenza nell'epidemiologia del cancro . Journal of Clinical Epidemiology , 56 (1), 38-43.

Ma ci sono sicuramente documenti migliori.


@chi: grazie mille. Guarderò i giornali. Per favore, potresti commentare la prima domanda? Il pericolo è sempre variabile?
yuk,

@yuk Non necessariamente, come suggerito da @whuber. Ho in mente un'altra applicazione della regressione di Cox che si occupa del trattamento del modello sistematico di risposte mancanti nei test educativi, poiché emerge quando uno studente non ha abbastanza tempo per completare il test (le risposte mancanti potrebbero essere considerate censurate a destra) - - in questo caso, si tratta di un ordinamento di articoli considerato come scala temporale. Guarderò il documento originale (anche se penso che questo sia stato anche l'argomento di un dottorato di ricerca).
chl

+1. Ci sono altri documenti, ma non sono sicuro che siano necessariamente migliori; Penso che Chalise faccia un ottimo lavoro riassumendo la situazione.
ars

7

No, non deve sempre essere il momento. Molte risposte censurate possono essere modellate con tecniche di analisi della sopravvivenza. Nel suo libro Nondetects and Data Analysis , Dennis Helsel sostiene l'utilizzo del negativo di una concentrazione nel tempo (per far fronte ai non rilevati, che quando negati diventano valori censurati a destra). Una sinossi è disponibile sul Web (formato pdf) e un pacchetto R, NADA , lo implementa.


+1, grazie per aver sottolineato il pacchetto NADA. Ho notato che semplifica la gestione dei dati censurati a sinistra attraverso il pacchetto di sopravvivenza - la censura a sinistra è uno scenario comune con dati ambientali?
ars

@whuber: Grazie per il commento, il pacchetto NADA sembra molto interessante.
yuk,

@Andy: grazie per i collegamenti. Penso che valga la pena essere una risposta. Voterei.
yuk,

@Yuk, per tua richiesta ho inserito il mio commento in una risposta e @whuber grazie per il tuo esempio.
Andy W,

@ars: Sì, la censura di sinistra è caratteristica dei dati ambientali (ed è una delle principali preoccupazioni della chemiometria in generale). È un problema complicato e interessante. Tra i motivi vi sono (1) i limiti di censura sono essi stessi determinati da stime statistiche (attraverso un processo di calibrazione), (2) la censura può avvenire in diversi modi - come limiti di rilevazione, limiti di quantificazione o "limiti di segnalazione" ( 3) le soglie spesso variano in risposta a covariate ("interferenze di matrice") che possono essere fortemente correlate ai valori censurati originali, (4) i dati sono spesso distribuiti in modo lognormale.
whuber

4

Sul tema della scala di età vs. scala di tempo, chl ha alcuni buoni riferimenti e cattura gli elementi essenziali - in particolare, il requisito che l'insieme a rischio contenga sufficienti soggetti di tutte le età come emergerebbe in uno studio longitudinale.

Vorrei solo notare che non esiste ancora un consenso generale su questo, ma ci sono alcune pubblicazioni che suggeriscono che l'età dovrebbe essere preferita come la scala temporale in alcuni casi. In particolare, se si verifica una situazione in cui il tempo non si accumula allo stesso modo per tutti i soggetti, ad esempio a causa dell'esposizione a materiale tossico, l'età potrebbe essere più appropriata.

D'altra parte, è possibile gestire quell'esempio specifico su un modello di Cox PH su scala temporale utilizzando age come covariata variabile nel tempo, anziché come covariata fissa all'inizio. Devi pensare al meccanismo dietro il tuo oggetto di studio per capire quale scala temporale è più appropriata. A volte vale la pena adattare entrambi i modelli ai dati esistenti per vedere se sorgono discrepanze e come potrebbero essere spiegate prima di progettare il nuovo studio.

Infine, l'ovvia differenza nell'analizzare i due è che su una scala di età, l'interpretazione della sopravvivenza è rispetto a una scala assoluta (età), mentre su una scala temporale è relativa alla data di inizio / ingresso dello studio .


3

Secondo la richiesta del PO, ecco un'altra applicazione che ho visto usare l'analisi di sopravvivenza in un contesto spaziale (sebbene ovviamente diverso dalla misurazione delle sostanze ambientali menzionate da whuber) sta modellando la distanza tra eventi nello spazio. Ecco un esempio in criminologia e qui uno in epidemiologia .

Il ragionamento alla base dell'utilizzo dell'analisi di sopravvivenza per misurare la distanza tra gli eventi non è, per così dire, un problema di censura (anche se la censura può sicuramente verificarsi in un contesto spaziale), lo è più a causa delle distribuzioni simili tra caratteristiche tempo-evento e distanza tra eventi caratteristiche (cioè hanno entrambi tipi simili di strutture di errore (spesso decadimento della distanza) che violano OLS e quindi le soluzioni non parametriche sono ideali per entrambi).


A causa delle mie cattive pratiche di citazione, ho dovuto trascorrere ore e ore a trovare il link / riferimento corretto al link sopra.

Per esempio in criminologia,

Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada e Yutaka Harada. 2010. Un'analisi spazio-temporale della vittimizzazione quasi ripetuta in Giappone . 8ª Conferenza nazionale sulla mappatura del crimine. Jill Dando Institute of Crime Science. PDF attualmente disponibile sulla pagina web di riferimento.

In epidemiologia,

Lettore, Steven. 2000. Utilizzo dell'analisi di sopravvivenza per studiare modelli di punti spaziali nell'epidemiologia geografica. Scienze sociali e medicina 50 (7-8): 985-1000.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.