Dal punto di vista statistico, si può dedurre la causalità usando i punteggi di propensione con uno studio osservazionale?


27

Domanda: Dal punto di vista dello statistico (o di un professionista), si può inferire la causalità usando i punteggi di propensione con uno studio osservazionale ( non un esperimento )?

Per favore, non vuoi iniziare una guerra alla fiamma o un dibattito fanatico.

Contesto: all'interno del nostro programma di dottorato di ricerca, abbiamo toccato l'inferenza causale solo attraverso gruppi di lavoro e alcune sessioni tematiche. Tuttavia, ci sono alcuni ricercatori di spicco in altri dipartimenti (ad es. HDFS, Sociologia) che li utilizzano attivamente.

Ho già assistito ad un acceso dibattito su questo tema. Non è mia intenzione iniziarne uno qui. Detto questo, quali riferimenti hai incontrato? Quali punti di vista hai? Ad esempio, un argomento che ho ascoltato contro i punteggi di propensione come tecnica di inferenza causale è che non si può mai inferire la causalità a causa della distorsione da omissione variabile - se si lascia fuori qualcosa di importante, si rompe la catena causale. È un problema irrisolvibile?

Disclaimer: questa domanda potrebbe non avere una risposta corretta - completamente interessante con il clic su cw, ma personalmente sono molto interessato alle risposte e sarei felice con alcuni buoni riferimenti che includono esempi del mondo reale.

Risposte:


16

All'inizio di un articolo che mirava a promuovere l'uso dei PS in epidemiologia, Oakes e Church (1) citavano le affermazioni di Hernán e Robins sull'effetto confondente in epidemiologia (2):

Potete garantire che i risultati del vostro studio osservazionale non siano influenzati da confusione non misurata? L'unica risposta che un epidemiologo può fornire è "no".

Questo non è solo per dire che non possiamo garantire che i risultati degli studi osservazionali siano imparziali o inutili (perché, come diceva @propofol, i loro risultati possono essere utili per la progettazione di RCT), ma anche che i PS non offrono certamente una soluzione completa a questo problema, o almeno non necessariamente producono risultati migliori rispetto ad altri metodi di matching o multivariati (vedi ad es. (10)).

I punteggi di propensione (PS) sono, per costruzione, indicatori probabilistici non causali . La scelta delle covariate che entrano nella funzione del punteggio di propensione è un elemento chiave per garantirne l'affidabilità e la loro debolezza, come è stato detto, deriva principalmente dal non controllo per i confonditori non osservati (che è molto probabile negli studi retrospettivi o caso-controllo ) . Altri fattori devono essere considerati: (a) la mancata specificazione del modello inciderà sulle stime dell'effetto diretto (non molto più che nel caso OLS), (b) potrebbero mancare dati a livello delle covariate, (c) i PS fanno non superare gli effetti sinergici che sono noti per influenzare l'interpretazione causale (8,9).

Per quanto riguarda i riferimenti, ho trovato le diapositive di Roger Newson - causalità, confondimenti e punteggi di propensione - relativamente ben bilanciate sui pro e contro dell'uso dei punteggi di propensione, con illustrazioni di studi reali. C'erano anche diversi buoni articoli che discutevano dell'uso dei punteggi di propensione negli studi osservazionali o nell'epidemiologia ambientale due anni fa in Statistics in Medicinee ne allego un paio alla fine (3-6). Ma mi piace la recensione di Pearl (7) perché offre una prospettiva più ampia sui problemi di causalità (i PS sono discussi p. 117 e 130). Ovviamente, troverai molte altre illustrazioni guardando la ricerca applicata. Vorrei aggiungere due articoli recenti di William R Shadish che sono stati pubblicati sul sito Web di Andrew Gelman (11,12). Viene discusso l'uso dei punteggi di propensione, ma i due articoli si concentrano maggiormente sull'inferenza causale negli studi osservazionali (e su come si confronta con le impostazioni randomizzate).

Riferimenti

  1. Oakes, JM e Church, TR (2007). Commento su invito: metodi avanzati di punteggio di propensione in epidemiologia . American Journal of Epidemiology , 165 (10), 1119-1121.
  2. Hernan MA e Robins JM (2006). Strumenti per inferenza causale: il sogno di un epidemiologo? Epidemiologia , 17, 360-72.
  3. Rubin, D. (2007). Il disegno contro l'analisi degli studi osservazionali per gli effetti causali: parallelamente al disegno di studi randomizzati . Statistica in medicina , 26, 20–36.
  4. Shrier, I. (2008). Lettera all'editore . Statistica in medicina , 27, 2740–2741.
  5. Pearl, J. (2009). Osservazioni sul metodo del punteggio di propensione . Statistica in medicina , 28, 1415-1424.
  6. Stuart, EA (2008). Sviluppare raccomandazioni pratiche per l'uso dei punteggi di propensione: discussione di "Una valutazione critica della corrispondenza dei punteggi di propensione nella letteratura medica tra il 1996 e il 2003" di Peter Austin . Statistica in medicina , 27, 2062–2065.
  7. Pearl, J. (2009). Inferenza causale nelle statistiche: una panoramica . Sondaggi statistici , 3, 96-146.
  8. Oakes, JM e Johnson, PJ (2006). Corrispondenza del punteggio di propensione per l'epidemiologia sociale . In Methods in Social Epidemiology , JM Oakes e S. Kaufman (Eds.), Pagg. 364-386. Jossez-Bass.
  9. Höfler, M (2005). Inferenza causale basata su controfattuali . Metodologia di ricerca medica BMC , 5, 28.
  10. Winkelmayer, WC e Kurth, T. (2004). Punteggi di propensione: aiuto o hype? Nephrology Dialisi Transplantation , 19 (7), 1671-1673.
  11. Shadish, WR, Clark, MH e Steiner, PM (2008). Gli esperimenti non randomizzati possono fornire risposte accurate? Un esperimento randomizzato che confronta compiti casuali e non casuali . JASA , 103 (484), 1334-1356.
  12. Cook, TD, Shadish, WR e Wong, VC (2008). Tre condizioni in base alle quali esperimenti e studi osservazionali producono stime causali comparabili: nuovi risultati da confronti all'interno dello studio . Journal of Policy Analysis and Management , 27 (4), 724–750.

11

I punteggi di propensione sono in genere utilizzati nella letteratura corrispondente. I punteggi di propensione utilizzano covariate pre-trattamento per stimare la probabilità di ricevere un trattamento. In sostanza, una regressione (o semplicemente OLS regolare o logit, probit, ecc.) Viene utilizzata per calcolare il punteggio di propensione con il trattamento poiché i risultati e le variabili di pretrattamento sono le covariate. Una volta ottenuta una buona stima del punteggio di propensione, i soggetti con punteggi di propensione simili, ma con trattamenti diversi ricevuti, vengono abbinati tra loro. L'effetto del trattamento è la differenza di mezzi tra questi due gruppi.

Rosenbaum e Rubin (1983) mostrano che l'abbinamento dei soggetti trattati e di controllo usando solo il punteggio di propensione è sufficiente per eliminare ogni pregiudizio nella stima dell'effetto del trattamento derivante dalle covariate di pretrattamento osservate utilizzate per costruire il punteggio. Si noti che questa prova richiede l'uso del punteggio di propensione reale, piuttosto che una stima. Il vantaggio di questo approccio è che trasforma un problema di abbinamento in più dimensioni (uno per ogni covariata di pre-trattamento) in un caso di abbinamento univariato, una grande semplificazione.

Rosenbaum, Paul R. e Donald B. Rubin. 1983. " Il ruolo centrale del punteggio di propensione negli studi osservazionali per gli effetti causali ". Biometrika. 70 (1): 41--55.


8

Solo un potenziale studio randomizzato può determinare la causalità. Negli studi osservazionali, ci sarà sempre la possibilità di una covariata non misurata o sconosciuta che rende impossibile attribuire la causalità.

Tuttavia, gli studi osservazionali possono fornire prove di una forte associazione tra xe y e sono quindi utili per la generazione di ipotesi. Queste ipotesi devono quindi essere confermate con uno studio randomizzato.


Sono pienamente d'accordo con te. Uno studio osservazionale può essere utile per scoprire alcune associazioni che a loro volta possono essere testate utilizzando un quadro molto più rigoroso (prova randomizzata come suggerisci).
Sympa,

Espressione ordinata Non posso essere più d'accordo con te sulla parola associazione "forte" tra xe y.
Kevin Kang,

7

La domanda sembra coinvolgere due cose che dovrebbero essere considerate separatamente. Il primo è se si può inferire la causalità da uno studio osservazionale, e su ciò si potrebbe contrastare il punto di vista, per esempio, di Pearl (2009), che sostiene sì finché si può modellare correttamente il processo, rispetto al punto di vista @propofol, che lo farà trovare molti alleati nelle discipline sperimentali e che potrebbero condividere alcuni dei pensieri espressi nel saggio (piuttosto oscuro ma comunque buono) di Gerber et al (2004). In secondo luogo, supponendo che si pensi che la causalità possa essere dedotta dai dati osservativi, ci si potrebbe chiedere se i metodi di punteggio di propensione sono utili nel fare ciò. I metodi di punteggio di propensione includono varie strategie di condizionamento e ponderazione inversa della propensione. Una bella recensione è data da Lunceford e Davidian (2004).

Un po 'di rughe: l'adattamento e la ponderazione del punteggio di propensione sono utilizzati anche nell'analisi di esperimenti randomizzati quando, per esempio, c'è un interesse nel calcolo degli "effetti indiretti" e anche quando ci sono problemi di attrito o abbandono potenzialmente non casuali ( nel qual caso ciò che hai assomiglia a uno studio osservazionale).

Riferimenti

Gerber A, et al. 2004. "L'illusione di imparare dalla ricerca osservazionale". In Shapiro I, et al, Problemi e metodi nello studio della politica , Cambridge University Press.

Lunceford JK, Davidian M. 2004. "Stratificazione e ponderazione tramite il punteggio di propensione nella stima degli effetti del trattamento causale: uno studio comparativo". Statistica in medicina 23 (19): 2937–2960.

Pearl J. 2009. Causalità (2a edizione) , Cambridge University Press.


Bene, hai citato l'intero libro di Pearl.
chl

0

La saggezza convenzionale afferma che solo studi controllati randomizzati (esperimenti "reali") possono identificare la causalità.

Tuttavia, non è così semplice.

Uno dei motivi per cui la randomizzazione potrebbe non essere sufficiente è che nei "piccoli" campioni la legge del gran numero non è "abbastanza forte" per garantire che tutte le differenze siano bilanciate. La domanda è: cos'è "troppo piccolo" e quando inizia "abbastanza grande"? Saint-Mont (2015) sostiene qui che "abbastanza grande" potrebbe iniziare tra le migliaia (n> 1000)!

Dopotutto, il punto è bilanciare le differenze tra i gruppi, controllare le differenze. Quindi, anche negli esperimenti, si dovrebbe prestare molta attenzione a bilanciare le differenze tra i gruppi. Secondo i calcoli di Saint-Mont (2015) potrebbe anche essere che in campioni più piccoli si possa essere notevolmente meglio con campioni abbinati (bilanciati manualmente).

Quanto alla probabilità. Naturalmente, la probabilità non è mai in grado di dare una risposta conclusiva, a meno che la probabilità non sia estrema (zero o una). Tuttavia, nella scienza, ci siamo trovati spesso di fronte a situazioni in cui non siamo in grado di fornire una risposta conclusiva in quanto le cose sono difficili. Da qui la necessità di probabilità. La probabilità non è altro che un modo per esprimere la nostra incertezza in una dichiarazione. Come tale, è simile alla logica; vedi Briggs (2016) qui .

Quindi, la probabilità ci aiuterà, ma non ci darà risposte conclusive, nessuna certezza. Ma è di grande utilità: esprimere incertezza.

Si noti inoltre che la causalità non è principalmente una questione statistica. Supponiamo che due mezzi differiscano "significativamente". Non significa che la variabile di raggruppamento è la causa della differenza nella variabile misurata? No (non necessariamente). Indipendentemente da quale particolare statistica si usi - punteggio di propensione, valori di p, fattori di Bayes e così via - tali metodi non sono (praticamente) mai sufficienti per sostenere le affermazioni causali.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.