Ponderazione del punteggio di propensione nell'analisi di Cox PH e selezione della covariata


11

Per quanto riguarda la ponderazione del punteggio di propensione (IPTW) durante la modellizzazione proporzionale del rischio di Cox dei dati di sopravvivenza tempo-evento:

Ho potenziali dati di registro in cui siamo interessati a esaminare l'effetto terapeutico di un farmaco che nella maggior parte dei casi i pazienti stavano già assumendo al basale. Non sono quindi sicuro di come analizzare al meglio i dati. Potenzialmente, alcune delle variabili di base sono in larga misura influenzate dal trattamento e non viceversa (ad esempio alcuni biomarcatori). Sono un po 'perso su quali covariate dovrei includere nel modello del punteggio di propensione per la stima dei pesi e quali covariate dovrei includere come covariate nel coxphmodello (se ce ne sono). Qualsiasi suggerimento nella giusta direzione sarebbe utile! Finora non sono stato in grado di trovare alcuna letteratura in merito a ciò nella modellazione CoxPh.

Sto pensando che le covariate che rappresentano trattamenti istituiti al basale che (potrebbero) influenzare il risultato dovrebbero essere incluse come covariate di Cox PH, ma non ne sono sicuro.

Come faccio a determinare quali variabili dovrebbero essere incluse come covariate nel modello Cox anziché essere utilizzate nel calcolo dei pesi del punteggio di propensione?


Domanda di follow-up:

Comprendo il problema intrinseco della valutazione dell'effetto terapeutico di un certo intervento che è già iniziato, ovvero prevalente tra i pazienti, prima dell'inizio dell'osservazione. Sia per quanto riguarda l'introduzione della distorsione correlata alla variazione temporale del rischio (ad es. Effetti collaterali avversi più comuni nel primo anno di terapia) sia per le covariate interessate dal trattamento. Se non sbaglio, questo è stato proposto come causa di discrepanza tra osservazione e randomizzata rispetto agli endpoint cardiovascolari e alla terapia ormonale sostitutiva. Nel mio set di dati, invece, siamo interessati a esaminare un possibile effetto avverso del trattamento.

Se uso l'adeguamento del punteggio di propensione per studiare l'effetto del trattamento tra gli utenti prevalenti, ovvero già utilizzando il farmaco prima dell'inizio dell'osservazione, nei dati di coorte e osserviamo un effetto negativo di una terapia farmacologica (e questo è quello che stavamo cercando). Posso escludere la possibilità di sopravvalutare il rischio associato al trattamento? Vale a dire fino a quando il rischio è significativamente elevato, è "sicuramente" non protettivo?

Non riesco a immaginare un esempio in cui questo tipo di distorsione possa introdurre una sopravvalutazione del rischio di falsa associazione del rischio in questo contesto.

Risposte:


9

In teoria, ogni variabile selezionata come parte del peso del punteggio di propensione non deve essere inclusa come covariate nel modello, poiché la ponderazione è già controllata per il loro potenziale confondimento. Con un modello di ponderazione adeguato puoi letteralmente modellare l'effetto dell'esposizione.

Detto questo, ci sono motivi per cui potresti voler includere termini nel modello:

  • Stime "Doppiamente robuste". Non vi è alcun motivo, salvo una perdita di precisione, che non è possibile utilizzare le variabili sia nel modello di ponderazione sia come covariate. In teoria, ti stai proteggendo dal confondere due modi (da cui questa tecnica viene definita "doppiamente robusta"). Tieni presente che questo ti protegge solo dal fatto che il modello PS o il modello covariato non vengano specificati dandoti una "seconda possibilità" per specificare il modello corretto, non è una soluzione magica.
  • Stime multiple di interesse. La ponderazione fa scomparire le stime degli effetti dalle covariate: se si desidera un coefficiente di regressione per la variabile, è necessario includerlo come covariata nel passaggio CoxPH e non nel modello PS.

Prova a cercare termini "doppiamente robusti" e simili in riviste come Epidemiology o The American Journal of Epidemiology , nonché nella letteratura biostatistica e dovresti scoprire alcune fonti utili.


Grazie per una risposta (rapida) e chiara! Ho visto menzionare doppiamente robusta, ma ho studiato molto. Lo farò sicuramente ora. Diresti che l'uso di stime doppiamente solide è giustificato quando le covariate non sono adeguatamente adeguate dopo la ponderazione (ad es.) Differenze ancora significative tra i gruppi di trattamento?
Kjetil Loland,

1
@KjetilLoland Questo potrebbe essere un motivo per usare una stima doppiamente robusta - in generale, è qualcosa da guardare ogni volta che sei preoccupato che un metodo per controllare le variabili soffre di errata specificazione. Verificherei anche che il tuo modello PS non funzioni e ti dia punteggi di propensione gradevoli e sovrapposti tra i due gruppi.
Fomite,

1
A causa della non collassabilità del hazard ratio, non è adeguato includere semplicemente le variabili nel PS. È comune lasciare che il PS includa il "lavello della cucina" e che i predittori più importanti conosciuti vengano nuovamente inclusi come covariate. Ciò impedirà di sottovalutare il rapporto di rischio dell'esposizione.
Frank Harrell,

Ancora una volta, grazie a @EpiGrad e Frank per le risposte. Non posso dire esattamente che i gruppi di trattamento hanno punteggi di propensione gradevoli e sovrapposti. Quindi probabilmente finirei con un ampio aggiustamento della covariata. Da un lato, ho notato che ho scritto IPTW, quando in realtà sto usando il pacchetto twang - che utilizza la regressione potenziata generalizzata per valutare i pesi (se ho ragione) - ma immagino che ciò non cambi l'approccio generale tanto.
Kjetil Loland,

@KjetilLoland Puoi almeno ispezionare visivamente se i tuoi punteggi PS si sovrappongono o meno guardando i grafici sovrapposti della loro distribuzione per gruppo di trattamento.
Fomite,

3

È importante distinguere "influenzato dal trattamento" e "correlato al trattamento". Quest'ultimo può includere fattori di selezione del trattamento come quelli che stiamo cercando di regolare con propensione e / o aggiustamento della covariata. "Interessato dal trattamento" implica che le covariate vengono misurate dopo il tempo zero (ad esempio, dopo la randomizzazione o dopo l'inizio del trattamento), il che significa che dovrebbero essere usate raramente.


Ancora grazie Dr. Harrell. Alcune delle nostre variabili sono sicuramente "influenzate dal trattamento". Il trattamento che stiamo cercando di indagare è stato avviato prima del basale, il che ovviamente non è l'ideale. Se la regolazione del punteggio di propensione sia o meno adatta a questo tipo di analisi è forse una domanda migliore. Non sono tuttavia a conoscenza di altri modi per indagare su questo.
Kjetil Loland,

Il disegno dello studio potrebbe non essere adatto a quello che vuoi fare. Lo studio sarà molto difficile da interpretare. Potresti convincere gli esperti in materia a provare a inventare un sottoinsieme di variabili che è altamente probabile che non cambino con il trattamento, ma l'adeguamento per il confondimento implicito può essere incompleto.
Frank Harrell,

Vedo. Immagino che questo inizi a somigliare un po 'ai vecchi studi osservazionali vs randomizzati sulla TOS sulla CVD. Correggimi se sbaglio, ma non è tutto il "rischio" di sottostimare il rischio di un possibile effetto negativo del trattamento (che è quello che stiamo cercando) - vale a dire finché mostriamo che il trattamento è avverso, quel tipo di confonditori potrebbe solo indebolire la scoperta? Ho aggiornato la domanda di conseguenza.
Kjetil Loland,

2
Questo è più di un problema osservativo vs. randomizzato, ma esiste una relazione con gli studi sulla TOS. Potresti avere ragione sul fatto che un ragionamento accurato potrebbe giustificare il trattamento dei risultati come un limite inferiore.
Frank Harrell,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.