Sconcertatezza nel modello causale di Rubin - spiegazione di Layman


12

Quando si implementa il modello causale di Rubin, uno dei presupposti (non verificabili) di cui abbiamo bisogno è l'incondondanza, il che significa

(Y(0),Y(1))T|X

Laddove l'LHS sono i controfattuali, T è il trattamento e X sono le covariate per le quali controlliamo.

Mi chiedo come descriverlo a una persona che non sa molto del modello causale di Rubin. Capisco perché teoricamente abbiamo bisogno di questo presupposto, ma non sono sicuro concettualmente del perché questo sia importante. In particolare, se T è il trattamento, il potenziale risultato non dovrebbe dipendere molto da esso? Come pure, se abbiamo uno studio randomizzato controllato, quindi automaticamente, . Perché questo vale?(Y(0),Y(1))T

Come descriveresti l'assurdità / l'assurdità per qualcuno che non ha studiato l'RCM?


Per quanto riguarda la corrispondenza del punteggio di propensione, in primo luogo è facile dimostrare che la distribuzione condizionale di coincide con la distribuzione condizionale di . Pertanto la mancanza di fondamento / ignorabilità implica che . Per le prove randomizzate, deve essere indipendente da qualsiasi altra variabile che partecipa alle prove. X | T = 0 , p ( X ) = q ( Y ( 0 ) , Y ( 1 ) ) T | p ( X ) TX | T=1,p(X)=qX | T=0,p(X)=q(Y(0),Y(1))  T | p(X)T
Viktor,

Risposte:


11

Come descriveresti l'assurdità / l'assurdità per qualcuno che non ha studiato l'RCM?

Per quanto riguarda l'intuizione a qualcuno che non è esperto di inferenza causale, penso che sia qui che potresti usare i grafici. Sono intuitivi nel senso che mostrano visivamente "flusso" e chiariranno anche cosa significa sostanzialmente l'ignoranza nel mondo reale.

L'ignoranza condizionale equivale a sostenere che soddisfa il criterio backdoor. Quindi, in termini intuitivi, puoi dire alla persona che le covariate che hai scelto per X "bloccano" l'effetto delle cause comuni di T e YXXTY (e non aprono altre associazioni spurie).

Se le uniche possibili variabili confondenti del tuo problema sono le variabili su stesso, allora è banale da spiegare. Dici solo che poiché X contiene tutte le cause comuni di T e Y , è tutto ciò che devi controllare. Quindi potresti dirle che è così che vedi il mondo:XXTY

inserisci qui la descrizione dell'immagine

Il caso più interessante è quando potrebbero esserci altri confusi plausibili là fuori. Per essere più specifici, potresti anche chiedere alla persona di nominare un potenziale confonditore del tuo problema, cioè chiederle di nominare qualcosa che causa sia che Y , ma non è in XTYX .

Dite i nomi di persona una variabile . Quindi puoi dire a quella persona che ciò che la tua assunzione condizionale di ignorabilità significa effettivamente è che pensi che X "bloccherà" l'effetto di Z su T e / o YZXZTY .

E dovresti darle una ragione sostanziale per cui pensi che sia vero. Ci sono molti grafici che potrebbero rappresentarlo, ma supponiamo che tu abbia trovato questa spiegazione: " non influenzerà i risultati perché anche se Z causa T e Y , il suo effetto su T passa solo attraverso X , che stiamo controllando per". ZZTYTXE quindi mostra questo grafico:

inserisci qui la descrizione dell'immagine

X li sta bloccando visivamente sui grafici.

Ora rispondendo alle domande concettuali:

In particolare, se T è il trattamento, il potenziale risultato non dovrebbe dipendere molto da esso? Inoltre, se abbiamo una sperimentazione controllata randomizzata, quindi automaticamente. Perché questo vale?

T come all'incarico di trattamento. Ciò che dice è che stai assegnando il trattamento alle persone che "ignorano" il modo in cui rispondono al trattamento (i potenziali esiti controfattuali). Una semplice violazione di questo sarebbe che tu tendi a dare il trattamento a coloro che potrebbero trarne il massimo beneficio.

Questo è anche il motivo per cui questo vale automaticamente quando si esegue la randomizzazione. Se scegli il trattamento a caso, questo significa che non hai controllato le loro potenziali risposte al trattamento per selezionarli.


Per completare la risposta, vale la pena notare che comprendere l'ignorabilità senza parlare del processo causale, cioè senza invocare equazioni strutturali / modelli grafici è davvero difficile. Nella maggior parte dei casi, i ricercatori fanno appello all'idea di "il trattamento è stato come se fosse casuale" ma senza giustificare il motivo per cui ciò è o perché è plausibile utilizzando meccanismi e processi del mondo reale.

In effetti, molti ricercatori assumono semplicemente l'ignoranza per comodità, al fine di giustificare l'uso di metodi statistici. Questo passaggio dal documento di Joffe, Yang e Feldman dice una verità scomoda che molti conoscono ma non dicono durante le presentazioni della conferenza: "I presupposti sull'ignorabilità sono di solito fatti perché giustificano l'uso dei metodi statistici disponibili e non perché si credono veramente".

Ma, come ho detto all'inizio della risposta, puoi usare i grafici per discutere se un incarico di trattamento è ignorabile o meno. Mentre il concetto stesso di ignorabilità è difficile da comprendere, poiché afferma giudizi su quantità controfattuali, nei grafici si stanno fondamentalmente facendo affermazioni qualitative sui processi causali (questa variabile provoca quella variabile ecc.), Che sono facili da spiegare e visivamente accattivanti.

Come menzionato in una risposta precedente, esiste un'equivalenza formale tra grafici e risultati potenziali . Quindi, puoi leggere anche i potenziali risultati dai grafici. Rendendo più formale questa connessione (per maggiori informazioni vedi Pearl's Causality, p.343), potresti ricorrere alla seguente definizione: i potenziali risultati rappresenterebbero il totale di tutte le variabili (termini osservati e di errore) che influenzano Y quando T è mantenuto costante .

TXY

Per riassumere, molti ricercatori formulano l'assunto di ignorabilità per impostazione predefinita, per comodità. È un modo conveniente per assumere la sufficienza di una serie di controlli senza bisogno di giustificare formalmente il perché di questo caso, ma per spiegare cosa significa in un contesto reale per un laico, bisognerebbe invocare una storia causale, cioè ipotesi causali e puoi formalmente raccontare quella storia con l'aiuto di grafici causali.


8

(Y0,Y1)Y

X

Y=TY1+(1T)Y0.

YTTY1(1T)Y0

TXXY1X


Guardando la parte in cui dici "Penso che ti stiano bloccando la differenza tra i risultati potenziali (Y0, Y1) e il risultato osservato Y. Quest'ultimo è molto influenzato dal trattamento, ma speriamo che la prima coppia non lo sia. " Questo può essere interpretato come "Il risultato osservato dipende dal trattamento, ma in un'ipotesi nulla di nessun effetto terapeutico, il trattamento non dovrebbe influenzare i potenziali esiti"? Perché speriamo che i potenziali esiti siano influenzati dai trattamenti
RayVelcoro,

1
Y1Y0

TY1(1T)Y0YT

@ user321627 Se si calcola la differenza nei risultati osservati per il trattamento e il controllo, dovrebbe essere ovvio.
Dimitriy V. Masterov,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.