Modello di rischio proporzionale di Cox e campione selezionato in modo non casuale


9

Esistono metodi per correggere la distorsione nel modello di rischio proporzionale di Cox causato da un campione selezionato in modo non casuale (qualcosa come la correzione di Heckman)?

Contesto :
diciamo che la situazione è la seguente:
- Durante i primi due anni tutti i clienti sono accettati.
- Dopo quei due anni viene costruito un modello Cox PH. Il modello prevede per quanto tempo i clienti utilizzeranno il nostro servizio.
- A causa della politica della società da ora in poi, vengono accettati solo i clienti con probabilità di sopravvivere 3 mesi superiore a 0,5, gli altri vengono respinti.
- Dopo altri due anni è necessario costruire un nuovo modello. Il problema è che il nostro obiettivo è solo per i client accettati e l'utilizzo di questi client potrebbe causare alcuni pregiudizi.


1
Qual è il punto di questa analisi? Un modello di Cox PH non prevede esplicitamente il tempo di insuccesso a meno che tu non stia incorporando alcuni metodi di smoothing o modellazione parametrica. Quali sono le variabili di stratificazione / regolazione in questo modello?
AdamO,

Risposte:


4

Il problema con il calcolo dei metodi parametrici con il modello semi-parametrico di Cox è che questo problema specifico è in realtà correlato a dati mancanti. Nonostante l'autore non abbia descritto come sta ottenendo previsioni di rischio assolute da un modello di Cox, dato che abbiamo una tale previsione di rischio basata su parametri del modello (e stime della funzione di rischio di base), la probabilità di inclusione nella seconda fase dei dati la raccolta dipende dalla previsione del rischio originale, quindi la mancanza dipende dalle variabili osservate, vale a dire la mancanza di dati casuali.
AdamO,

2

La semplice risposta è la ponderazione. Cioè, puoi usare pesi per standardizzare i gruppi nel gruppo "accettato" alla popolazione di interesse. Il problema che deriva dall'utilizzo di tali pesi in un'analisi aggregata utilizzando sia la prima che la seconda fase di 2 anni è che i pesi stimati della popolazione e i parametri sono ora dipendenti. Viene generalmente utilizzato l'approccio pseudolikelihood (in questo caso, sarebbe una sorta di probabilità pseudo-parziale) in cui si ignora la dipendenza tra pesi campione e stime dei parametri. Tuttavia, in molte circostanze pratiche (e questa non è diversa), è necessario tenere conto di questa dipendenza. La questione della creazione di uno stimatore efficiente dei rapporti di rischio è difficile e per quanto ne so a tempo indeterminato.

Stima Horvitz-Thompson migliorata dei parametri del modello da campioni stratificati bifase: applicazioni in epidemiologia .

L'articolo discute i metodi di indagine, generalmente applicati nella regressione logistica, tuttavia è possibile ponderare anche i dati di sopravvivenza. Alcune considerazioni importanti che hai trascurato di menzionare sono se sei interessato a creare una previsione che si applica a tutta la popolazione, o alla popolazione "qualificata" in base alle stime a 2 anni o alla popolazione "qualificata" in base al risultato modello. Inoltre, non hai menzionato esattamente il modo in cui un modello di "previsione" viene creato da un modello Cox, poiché i valori adattati da un modello Cox non possono essere interpretati come rischi. Presumo che si stimino i rapporti di rischio, quindi si ottenga una stima regolare della funzione di rischio di base.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.