Effetto causale delle regolazioni della porta posteriore e della porta anteriore


12

Se volessimo calcolare l'effetto causale di su nel grafico causale di seguito, possiamo usare sia i teoremi di regolazione della porta di servizio che quelli di regolazione della porta di casa, cioè XY

P(y|do(X=x))=uP(y|x,u)P(u)

e

P(y|do(X=x))=zP(z|x)xP(y|x,z)P(x).

È un compito facile dimostrare che le due regolazioni portano allo stesso effetto causale di su ?XY

Grafico


È un vero compito? Quindi aggiungi il tag di studio autonomo. Quindi le persone possono darti suggerimenti, lasciandoti il ​​pensiero (e l'apprendimento). Dicci cosa hai provato e dove sei bloccato. Ricorda che CV non è per i compiti di outsourcing ...
Knarpie,

5
Ciao Knarpie, fa parte dello studio personale e non dei compiti. Attualmente sto leggendo "Inferenza causale in statistica" di Pearl et al. e trascorro circa 1 ora a riflettere sulla domanda che ho posto sopra, poiché è una domanda naturale da porre, ma non è stata in grado di mostrare l'uguaglianza. O mi manca qualcosa qui, o le due espressioni non sono uguali.
Jae,

Risposte:


13

L'azione corrisponde a un intervento sulla variabile che la imposta suX xdo(x)Xx X X X . Quando interveniamo su , ciò significa che i genitori di non influiscono più sul suo valore, il che corrisponde alla rimozione delle frecce che puntano a Quindi rappresentiamo questo intervento su un nuovo DAG.XXX

inserisci qui la descrizione dell'immagine

Chiamiamo la distribuzione osservativa originale e la distribuzione post-intervento . Il nostro obiettivo è quello di esprimere in termini di . Si noti che in si ha che . Inoltre, le probabilità pre-interventistiche e post-interventistiche condividono queste due invarianze: e poiché non ci siamo toccati qualsiasi freccia che inserisca quelle variabili nel nostro intervento. Così:P P P P U X P ( U ) = P ( U ) P ( Y | X , U ) = P ( Y | X , U )PPPPPUXP(U)=P(U)P(Y|X,U)=P(Y|X,U)

P(Y|do(X)):=P(Y|X)=UP(Y|X,U)P(U|X)=UP(Y|X,U)P(U)=UP(Y|X,U)P(U)

La derivazione della porta d'ingresso è un po 'più elaborata. Per prima cosa nota che non c'è confusione tra e , quindi,ZXZ

P(Z|do(X))=P(Z|X)

Inoltre, usando la stessa logica per derivare vediamo che controllare per è sufficiente per derivare l'effetto di su , cioèX Z YP(Y|do(X))XZY

P(Y|do(Z))=XP(Y|X,Z)P(X)

Dove sto usando il primo per comodità di notazione per la prossima espressione. Quindi queste due espressioni sono già in termini di distribuzione pre-intervento e abbiamo semplicemente usato la precedente logica backdoor per ricavarle.

L'ultimo pezzo abbiamo bisogno è inferire l'effetto di su combinando l'effetto di sulla e su . Per farlo, nota nel nostro grafico , poiché l'effetto di su è completamente mediata da e il percorso backdoor da a viene bloccata quando intervenendo su . Quindi:Y Z Y X Z P ( Y | Z , d o ( X ) ) = P ( Y | d o ( Z ) , d o ( X ) ) = P ( Y | d o ( Z ) ) X Y Z Z Y XXYZYXZP(Y|Z,do(X))=P(Y|do(Z),do(X))=P(Y|do(Z))XYZZYX

P(Y|do(X))=ΣZP(Y|Z,do(X))P(Z|do(X))=ΣZP(Y|do(Z))P(Z|do(X))=ΣZΣX'P(Y|X',Z)P(X')P(Z|X)=ΣZP(Z|X)ΣX'P(Y|X',Z)P(X')

Dove può essere compreso nel modo seguente: quando intervengo su , la distribuzione di cambia in ; ma in realtà sto intervenendo su quindi voglio sapere con quale frequenza assumerebbe un valore specifico quando cambio , che è .Z Y P ( Y | d o ( Z ) ) X Z X P ( Z | d o ( X ) )ΣZP(Y|do(Z))P(Z|do(X))ZYP(Y|do(Z))XZXP(Z|do(X))

Quindi, i due aggiustamenti ti danno la stessa distribuzione post-interventistica su questo grafico, come abbiamo mostrato.


Rileggendo la tua domanda mi è venuto in mente che potresti essere interessato a mostrare direttamente che il lato destro delle due equazioni è uguale nella distribuzione pre-interventistica (che devono essere, data la nostra precedente derivazione). Non è difficile mostrarlo anche direttamente. Basta dimostrare che nel tuo DAG:

ΣX'P(Y|Z,X')P(X')=ΣUP(Y|Z,U)P(U)

Si noti che il DAG implica e quindi:U Z | XYX|U,ZUZ|X

ΣX'P(Y|Z,X')P(X')=ΣX'(ΣUP(Y|Z,X',U)P(U|Z,X'))P(X')=ΣX'(ΣUP(Y|Z,U)P(U|X'))P(X')=ΣUP(Y|Z,U)ΣX'P(U|X')P(X')=ΣUP(Y|Z,U)P(U)

Quindi:

ΣZP(Z|X)ΣX'P(Y|X',Z)P(X')=ΣZP(Z|X)ΣUP(Y|Z,U)P(U)=ΣUP(U)ΣZP(Y|Z,U)P(Z|X)=ΣUP(U)ΣZP(Y|Z,X,U)P(Z|X,U)=ΣUP(Y|X,U)P(U)

2
Questa è una risposta molto buona ed esauriente. La parte in cui si identifica l'effetto causale attraverso la porta d'ingresso è tuttavia superflua (OP l'ha già fatto e segue direttamente il teorema della porta d'ingresso) e contiene anche un errore: Non esiste una "legge del totale probabilità "per effetti causali. Cioè, generalmente non equivale a , ma piuttosto , che è chiaramente diverso. Vedi il grande libro di Pearl alle pagine 87--88.Z P ( Y | d o ( Z ) ) P ( Z | d o ( X ) Z P ( Y | Z , d o ( X ) ) P ( Z | d o ( X ) )P(Y|do(X))ΣZP(Y|do(Z))P(Z|do(X)ΣZP(Y|Z,do(X))P(Z|do(X))
Julian Schuessler,

@JulianSchuessler è per questo che ho scritto "può essere pensato come", come un modo per aiutare a capire, ma non letteralmente dire che lo è. Per quanto riguarda la derivazione della porta d'ingresso, non era chiaro che l'OP sapesse come ottenerlo, ecco perché l'ho messo lì.
Carlos Cinelli,

Bella risposta. Grazie Carlos. La seconda parte della tua risposta è stata esattamente quello che ho chiesto. Ho due domande di follow-up qui. 1) Quale strategia di ricerca hai usato per manipolare algebricamente le espressioni nella tua seconda risposta? (Strizzando gli occhi abbastanza a lungo nelle espressioni?) Dato che lo spazio di ricerca è ampio, mi chiedo come sia possibile scrivere un algoritmo per poter giungere automaticamente alla stessa conclusione.
Jae,

2) Ero anche confuso su come interpretare , poiché la mia prima intuizione era come il suggerimento di Julian. Il libro di cui ho parlato usa la tua espressione. Mi chiedo se, in generale, quando si considera una catena diretta in cui il nodo iniziale è la causa e il nodo finale è l'effetto, ogni fattore deve essere condizionato su e non su , dove è una nota intermedia nella catena.fare ( Z ) Z ZΣzP(Y|fare(Z)P(Z|fare(X))fare(Z)ZZ
Jae

1
@Jeevaka questo è un presupposto codificato nel DAG, implicito nella sua fattorizzazione e nel presupposto che il sistema sia composto da pezzi modulari e autonomi. Pertanto, i cambiamenti in non influiscono su . Un modo per aiutare a pensare a questo è quello di scrivere le equazioni strutturali di entrambi i modelli (modello osservativo) e (modello interventistico) e quindi derivare le distribuzioni implicite e . Vedrai che il condizionale di dato e sarà lo stesso in entrambi. P ( Y | X , U ) M M P P Y X UP(X,U)P(Y|X,U)MM*PP*YXU
Carlos Cinelli,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.