La spiegazione di Layman sulla censura nell'analisi della sopravvivenza


13

Ho letto cos'è la censura e come deve essere spiegata nell'analisi di sopravvivenza, ma mi piacerebbe ascoltarne una definizione meno matematica e una definizione più intuitiva (le immagini sarebbero fantastiche!). Qualcuno può darmi una spiegazione di 1) censura e 2) come influisce su cose come le curve di Kaplan-Meier e la regressione di Cox?


Suggerisco di ascoltare il podcast della Digressione lineare sull'analisi della sopravvivenza e di ascoltare la loro definizione semplificata della censura sinistra e destra e la motivazione per il modello cox.
Uri Goren,

Risposte:


16

La censura è spesso descritta in confronto al troncamento . Una bella descrizione dei due processi è fornita da Gelman et al (2005, p. 235):

I dati troncati differiscono dai dati censurati che non è disponibile alcun conteggio delle osservazioni oltre il punto di troncamento. Con la censura si perdono i valori delle osservazioni oltre il punto di troncamento, ma si osserva il loro numero.

Il censimento o il troncamento possono verificarsi per valori superiori a un certo livello (censura di destra), inferiori a un certo livello (censura di sinistra) o entrambi.

Di seguito puoi trovare un esempio di distribuzione normale standard che viene censurata al punto 2.0 (al centro) o troncato a 2.0(giusto). Se il campione viene troncato, non abbiamo dati oltre il punto di troncamento, con valori campione censurati sopra il punto di troncamento vengono "arrotondati" al valore limite, quindi sono sovrarappresentati nel campione.

inserisci qui la descrizione dell'immagine

Un esempio intuitivo di censura è che chiedi ai tuoi intervistati la loro età, ma la registra solo fino a un certo valore e tutte le età al di sopra di questo valore, diciamo 60 anni, vengono registrate come "60+". Questo porta ad avere informazioni precise per i valori non censurati e nessuna informazione sui valori censurati.

Un esempio non così tipico di censura nella vita reale è stato osservato nei punteggi degli esami maturi polacchi che hanno attirato molta attenzione su Internet . L'esame viene sostenuto alla fine del liceo e gli studenti devono superarlo per poter fare domanda per l'istruzione superiore. Riesci a indovinare dalla trama in basso qual è la quantità minima di punti di cui gli studenti hanno bisogno per superare l'esame? Non sorprende che il "divario" nella distribuzione altrimenti normale possa essere facilmente "colmato" se si prende una frazione appropriata dei punteggi sovrarappresentati appena sopra la bozza di censura.

inserisci qui la descrizione dell'immagine

In caso di analisi di sopravvivenza

la censura si verifica quando abbiamo alcune informazioni sul tempo di sopravvivenza individuale, ma non conosciamo esattamente il tempo di sopravvivenza

(Kleinbaum e Klein, 2005, p. 5). Ad esempio, trattate i pazienti con alcuni farmaci e li osservate fino alla fine dello studio, ma non sapete cosa succede loro dopo la fine dello studio (c'erano ricadute o effetti collaterali?), L'unica cosa che sapete è che " sopravvissuto " almeno fino alla fine dello studio.

Di seguito puoi trovare esempi di dati generati dalla distribuzione di Weibull modellati usando lo stimatore Kaplan – Meier. La curva blu segna il modello stimato sull'intero set di dati, nel diagramma centrale è possibile vedere il campione censurato e il modello stimato sui dati censurati (curva rossa), a destra si vede il campione troncato e il modello stimato su tale campione (curva rossa). Come puoi vedere, i dati mancanti (troncamento) hanno un impatto significativo sulle stime, ma la censura può essere facilmente gestita utilizzando modelli di analisi di sopravvivenza standard.

inserisci qui la descrizione dell'immagine

Ciò non significa che non è possibile analizzare campioni troncati, ma in questi casi è necessario utilizzare modelli per i dati mancanti che provano a "indovinare" le informazioni sconosciute.


Kleinbaum, DG e Klein, M. (2005). Analisi di sopravvivenza: un testo di autoapprendimento. Springer.

Gelman, A., Carlin, JB, Stern, HS e Rubin, DB (2005). Analisi dei dati bayesiani. Chapman & Hall / CRC.


Sai da dove viene questa trama Matura? Ho provato a cercare su Google e continuo a ottenere il link reddit ma quello non contiene alcun riferimento. Conduce solo a imgur.com senza alcuna attribuzione. AGGIORNAMENTO: Trovato. cke.edu.pl//images/files/matura/informacje_o_wynikach/2013/… pagina 18.
amoeba dice Reinstate Monica

1
@amoeba se sei interessato a ulteriori dettagli non esitare a contattarmi. La maggior parte dei materiali su questo argomento che conosco sono purtroppo in polacco. L'immagine è una cosa, ma un mio amico ha fatto un'analisi più dettagliata di questi dati (a proposito, è disponibile su richiesta).
Tim

2

Il censimento è fondamentale per l'analisi della sopravvivenza.

L'idea di base è che l'informazione è censurata, è invisibile per te. In poche parole, si ottiene una distribuzione censurata dei tempi di vita se si registrano i tempi di vita prima che tutti nel campione siano morti. Se pensate al tempo che si muove "verso destra" sull'asse X, questo può essere chiamato censura a destra.

Esistono anche altri tipi: censura di sinistra e censura delle finestre. Vedi ad esempio il testo di Allison del 1984 sull'analisi della storia degli eventi, pubblicato da Sage per un'introduzione istruttiva.

Esempio: se si stanno calcolando i tassi di divorzio nella popolazione, si desidera includere solo le persone a rischio di divorzio (ovvero, sono sposate). Se le persone finiscono il loro matrimonio per motivi diversi dal divorzio (lutto, annullamento), allora si desidera censurarli. Non sono più a rischio di divorzio. Le stime (e le trame) di Kaplan-Meier non dovrebbero includere osservazioni censurate dopo il momento in cui sono censurate, ma dovrebbero includerle fino a quel momento.


Grafica o grafici?
RustyStatistician,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.