Perché la corrispondenza del punteggio di propensione funziona per l'inferenza causale?


13

La corrispondenza del punteggio di propensione viene utilizzata per fare inferenze causali negli studi osservazionali (vedi il documento Rosenbaum / Rubin ). Qual è la semplice intuizione dietro perché funziona?

In altre parole, perché se ci assicuriamo che la probabilità di partecipare al trattamento sia uguale per i due gruppi, gli effetti di confusione scompaiono e possiamo usare il risultato per trarre conclusioni causali sul trattamento?


8
Il mio è probabilmente un'opinione impopolare, ma penso che dire che il PSM ti consente di fare inferenze causali stia allungando un po '. Sì, si tratta di un metodo di corrispondenza più fine rispetto alla semplice corrispondenza "grezza" su una manciata di variabili, ma alla fine della giornata, stai ancora confrontando solo su quelle variabili che sono osservabili per te. Potresti avere ancora un trattamento endogeno, ma supponi che dopo il match il trattamento sia esogeno. Ma poi di nuovo, non sono nessuno rispetto a quelli come Rubin :)
Marchese de Carabas,

5
C'è chi non è d'accordo con Rosenbaum e Rubin. Gary King ha sostenuto piuttosto efficacemente che i risultati della corrispondenza usando il PSM sono inferiori ai risultati ottenuti dalla corrispondenza basata sulla distanza di Mahalanobis. Vedi il suo articolo qui ... gking.harvard.edu/files/gking/files/psnot.pdf?m=1456683191 Inoltre, questo webinar fornisce prove ancora più convincenti ... metodi-colloquium.com/…
Mike Hunter

4
In teoria, PUOI fare un'inferenza causale applicando il modello causale di Rubin se tutte le ipotesi sono soddisfatte. Ma ovviamente il diavolo è sempre nei dettagli dell'assunzione, e per me l'assunzione di confonditori non osservati è spesso dura. In effetti, è impossibile dimostrarlo. Ma puoi almeno eseguire analisi di sensibilità per determinare cosa ci vorrebbe per cambiare le tue conclusioni se avessi confonditori inosservati.
StatStudent

5
Buon punto @DJohnson. Ci sono anche artisti del calibro di Judea Pearl, Ian Shrier e Arvid Sjolander che sono critici nei confronti del Potential Outcomes Framework di Rubin per l'inferenza causale a causa della possibilità di introdurre "pregiudizi M" attraverso quello che chiamano "collider". Sono letture interessanti e dovrebbero integrare eventuali letture di Rubin.
StatStudent

Risposte:


12

Proverò a darti una comprensione intuitiva con un'enfasi minima sulla matematica.

Il problema principale con i dati e le analisi osservazionali che ne derivano è confuso. La confusione si verifica quando una variabile influenza non solo il trattamento assegnato ma anche i risultati. Quando viene eseguito un esperimento randomizzato, i soggetti vengono randomizzati ai trattamenti in modo tale che, in media, i soggetti assegnati a ciascun trattamento debbano essere simili rispetto alle covariate (età, razza, genere, ecc.). Come risultato di questa randomizzazione, è improbabile (specialmente in grandi campioni) che le differenze nei risultati siano dovute a eventuali covariate, ma a causa del trattamento applicato, poiché, in media, le covariate nei gruppi di trattamento sono simili.

D'altra parte, con dati osservativi non esiste un meccanismo casuale che assegni i soggetti ai trattamenti. Prendiamo ad esempio uno studio per esaminare i tassi di sopravvivenza dei pazienti a seguito di un nuovo intervento al cuore rispetto a una procedura chirurgica standard. In genere non è possibile randomizzare i pazienti a ciascuna procedura per motivi etici. Di conseguenza, pazienti e medici si autoselezionano in uno dei trattamenti, spesso a causa di una serie di ragioni legate alle loro covariate. Ad esempio, la nuova procedura potrebbe essere leggermente più rischiosa se si è anziani e, di conseguenza, i medici potrebbero raccomandare il nuovo trattamento più spesso ai pazienti più giovani. Se ciò accade e osservi i tassi di sopravvivenza, il nuovo trattamento potrebbe sembrare più efficace, ma ciò sarebbe fuorviante poiché i pazienti più giovani sono stati assegnati a questo trattamento e i pazienti più giovani tendono a vivere più a lungo, tutto il resto è uguale. È qui che i punteggi di propensione sono utili.

I punteggi di propensione aiutano con il problema fondamentale dell'inferenza causale - che potresti avere confusione a causa della non randomizzazione dei soggetti ai trattamenti e questa potrebbe essere la causa degli "effetti" che stai vedendo piuttosto che l'intervento o il trattamento da solo. Se tu fossi in grado di modificare in qualche modo la tua analisi in modo tale che le covariate (diciamo età, sesso, genere, stato di salute) fossero "bilanciate" tra i gruppi di trattamento, avresti forti prove che la differenza nei risultati è dovuta all'intervento / trattamento piuttosto che queste covariate. Punteggi di propensione, determinano la probabilità di ciascun soggetto di essere assegnato al trattamento che hanno ricevuto dato l'insieme delle covariti osservate. Se poi abbini queste probabilità (punteggi di propensione),

Potresti chiedere perché non corrispondere esattamente alle covariate (ad esempio assicurati di abbinare uomini di 40 anni in buona salute nel trattamento 1 con uomini di 40 anni in buona salute nel trattamento 2)? Questo funziona bene per campioni di grandi dimensioni e alcune covariate, ma diventa quasi impossibile farlo quando la dimensione del campione è piccola e il numero di covariate è anche di dimensioni moderate (vedere la maledizione della dimensionalità su Cross-Validated per il motivo per cui questo è il caso) .

Ora, detto tutto ciò, il tallone d'Achille del punteggio di propensione è l'assunto di nessun confonditore inosservato. Questo presupposto afferma che non hai omesso di includere alcuna covariata nel tuo aggiustamento che potrebbe essere fonte di confusione. Intuitivamente, la ragione di ciò è che se non hai incluso un confonditore durante la creazione del tuo punteggio di propensione, come puoi adattarti? Vi sono inoltre ipotesi aggiuntive come l'assunzione del valore del trattamento unitario stabile, secondo cui il trattamento assegnato a un soggetto non influisce sul potenziale esito degli altri soggetti.


7

In senso stretto, l'aggiustamento del punteggio di propensione non ha più a che fare con l'inferenza causale di quanto non faccia il modello di regressione. L'unica vera differenza con i punteggi di propensione è che rendono più semplice la regolazione per potenziali più confondenti osservati di quanto la dimensione del campione possa consentire l'inclusione dei modelli di regressione. L'adeguamento del punteggio di propensione (fatto meglio attraverso l'aggiustamento della covariata nella maggior parte dei casi, usando una spline nel logit PS) può essere pensato come una tecnica di riduzione dei dati in cui la riduzione è lungo un asse importante - confondendo. Tuttavia, non gestisce l'eterogeneità del risultato (bias di suscettibilità), pertanto è necessario anche adeguarsi alle covariate importanti anche quando si utilizzano le propensioni (vedere anche i problemi relativi alla non collassabilità delle probabilità e dei rapporti di rischio).

La corrispondenza del punteggio di propensione può escludere molte osservazioni e quindi essere terribilmente inefficiente. Considero qualsiasi metodo che escluda osservazioni pertinenti come problematiche. Il vero problema con la corrispondenza è che esclude le osservazioni facilmente corrispondenti a causa della necessità percepita di avere una corrispondenza 1: 1 e la maggior parte degli algoritmi di corrispondenza dipendono dall'ordine di osservazione.

Si noti che è molto semplice quando si esegue la regolazione della regressione standard per il confondimento verificare ed escludere regioni non sovrapposte. Agli utenti del punteggio di propensione viene insegnato a fare questo e l'unica ragione per cui i modellisti della regressione non lo fanno è che non gli viene insegnato.

L'analisi del punteggio di propensione nasconde tutte le interazioni con l'esposizione e il punteggio di propensione corrispondente nasconde inoltre una possibile relazione tra PS ed effetto del trattamento.

L'analisi della sensibilità (ai confondenti non misurati) è stata elaborata per la PS, ma è ancora più facile da fare con i modelli di regressione standard.

Se si utilizzano metodi di regressione flessibili per stimare il PS (ad esempio, non supporre che le variabili continue agiscano in modo lineare) non è nemmeno necessario verificare l'equilibrio - deve esserci un equilibrio o il modello di regressione PS non è stato correttamente specificato all'inizio . Devi solo verificare la non sovrapposizione. Ciò presuppone che non vi siano interazioni importanti che sono state omesse dal modello di propensione. La corrispondenza fa lo stesso presupposto.


3

Consiglio di dare un'occhiata a Mostly Harmless Econometrics: ne hanno una buona spiegazione a livello intuitivo.

Il problema che stai cercando di risolvere è la distorsione da selezione. Se una variabile è correlata con i potenziali esiti e con la probabilità di ricevere un trattamento, allora se scopri che il risultato atteso del trattamento è migliore del risultato atteso del non trattato, questo può essere una scoperta spuria poiché i trattati tendono ad avere una maggiore e quindi una . Il problema sorge perché rende correlato al trattamento.y 0 i , y 1 i x y 0 i , y 1 i x y 0 i , y 1 ixiy0i,y1ixy0i,y1ixy0i,y1i

Questo problema può essere risolto controllando per . Se pensiamo che la relazione tra i potenziali esiti e le variabili sia lineare, lo facciamo semplicemente includendo in una regressione con una variabile fittizia per il trattamento e la variabile fittizia interagisce con . Naturalmente, la regressione lineare è flessibile poiché possiamo includere anche funzioni di . E se non volessimo imporre una forma funzionale? Quindi dobbiamo usare un approccio non parametrico: la corrispondenza.x x x xxxxxx

Con la corrispondenza, confrontiamo le osservazioni trattate e non trattate con simili . Ci allontaniamo da questo con una stima dell'effetto del trattamento per tutti i valori (o piccoli intervalli di valori o "secchi") per i quali abbiamo sia osservazioni trattate che non trattate. Se non abbiamo molti di questi valori o bucket , in particolare se è un vettore ad alta dimensione, quindi è difficile trovare osservazioni vicine l'una all'altra, è utile proiettare questo spazio su una dimensione.x x xxxxx

Questo è ciò che fa la corrispondenza del punteggio di propensione. Se non sono correlati con il trattamento dato , allora risulta che sono anche non correlati con il trattamento dato dove è la probabilità del trattamento dato , cioè il punteggio di propensione di . x i p ( x i ) p ( x ) x xy0i,y1ixip(xi)p(x)xx

Ecco la tua intuizione: se troviamo un sottocampione di osservazioni con un punteggio di propensione molto simile , quindi per quel sottocampione, i gruppi trattati e non trattati non sono correlati con . È altrettanto probabile che ogni osservazione sia trattata o non trattata; ciò implica che qualsiasi osservazione trattata provenga ugualmente da uno qualsiasi dei valori nel sottocampione. Poiché è ciò che determina i potenziali risultati nel nostro modello, ciò implica che, per quel sottocampione, i potenziali risultatix x x y 0 i , y 1 ip(x)xxxy0i,y1inon sono correlati al trattamento. Questa condizione garantisce che la differenza media di esito del sottocampione tra il trattato e il non trattato sia una stima coerente dell'effetto medio del trattamento su questo sottocampione, vale a dire

E[yi|Treated,p(x)]E[yi|Untreated,p(x)]

è una stima coerente dell'effetto di trattamento medio locale.

Ulteriori letture:

Dovremmo davvero utilizzare la corrispondenza del punteggio di propensione nella pratica?

Domanda correlata che confronta corrispondenza e regressione


1

"Funziona" per lo stesso motivo per cui "la regressione" funziona: stai controllando tutti i fattori di confusione.

È possibile ottenere tale controllo analitico mediante un modello di regressione completamente specificato con forse molte variabili confondenti, o un modello di regressione con una sola variabile: il punteggio di propensione (che può essere o meno un modello ugualmente complicato costituito da quegli stessi fattori confondenti). È possibile attenersi a questa regressione rispetto al punteggio di propensione oppure è possibile confrontare la risposta all'interno di gruppi simili, in cui la somiglianza è definita dal punteggio di propensione. Nello spirito stai facendo la stessa cosa, ma alcune persone ritengono che quest'ultimo metodo evidenzi meglio il compito causale a portata di mano.

Aggiornamento dopo il feedback

Il mio pensiero per spiegare l'intuizione alla base del perché la corrispondenza del punteggio di propensione funziona era spiegare il Teorema del punteggio di propensione , cioè qualcosa che pensavo di poter fare usando la regressione. Ma come sostiene @StatsStudent, la regressione rende facile estrapolare i confronti tra trattamento e controllo che non si verificano mai nei dati. Se questo fa parte del motivo per cui il punteggio di propensione corrispondente "funziona", allora la mia risposta era incompleta. Ho consultato Controfattuali e inferenza causale

Y(0),Y(1)T|XY(0),Y(1)T|p(X),
e leggi una versione della corrispondenza del vicino più vicino, chiamata "corrispondenza della pinza" (p. 108) in cui i punteggi di propensione del trattamento e il caso di controllo più vicino devono trovarsi a una distanza massima, determinando alcuni casi di trattamento senza corrispondenze. In questo caso, il metodo funzionerebbe comunque aggiustando il punteggio di propensione usando un analogo non parametrico alla regressione, ma chiarisce anche cosa non si può sapere dai soli dati (senza un modello da cui estrapolare) e consentendo una ridefinizione di la quantità causale dati i dati disponibili.

1
Questa risposta è destinata a non essere apprezzata perché riduce i metodi del punteggio di propensione confrontandoli con la regressione, una parolaccia nei circoli causali. Ma la risposta principale ammette che "il tallone d'Achille del punteggio di propensione è l'assunto di nessun confonditore inosservato". È un tallone d'Achille piuttosto grande. Supponiamo che il presupposto sia soddisfatto e ho un set di dati con tutti i confonditori nell'universo. Aiutami a capire perché la regressione non funzionerà per scoprire la verità causale, ma corrisponderà il punteggio di propensione.
Ben Ogorek,

1
Il motivo per cui la regressione è spesso problematico è perché i risultati della regressione sono estrapolati. Con i punteggi di propensione, durante i controlli di equilibrio della covariata si assicura che vi sia sufficiente sovrapposizione di confondenti tra i gruppi di trattamento. Questo non è necessariamente il caso della regressione e può portare a stime imprecise in quanto non esistono controlli diagnostici standard che indichino che il modello di regressione è estrapolato. Ecco perché di solito eseguo controlli di bilanciamento del punteggio di propensione anche se sto solo eseguendo un modello di regressione e non intendo utilizzare i punteggi di propensione stessi.
StatStudent
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.