L'azione corrisponde a un intervento sulla variabile che la imposta suX xdo ( x )XX X X X . Quando interveniamo su , ciò significa che i genitori di non influiscono più sul suo valore, il che corrisponde alla rimozione delle frecce che puntano a Quindi rappresentiamo questo intervento su un nuovo DAG.XXX
Chiamiamo la distribuzione osservativa originale e la distribuzione post-intervento . Il nostro obiettivo è quello di esprimere in termini di . Si noti che in si ha che . Inoltre, le probabilità pre-interventistiche e post-interventistiche condividono queste due invarianze: e poiché non ci siamo toccati qualsiasi freccia che inserisca quelle variabili nel nostro intervento. Così:P ∗ P ∗ P P ∗ U ⊥ X P ∗ ( U ) = P ( U ) P ∗ ( Y | X , U ) = P ( Y | X , U )PP*P*PP*U⊥ XP*( U) = P( U)P*( Y| X, U) = P( Y| X, U)
P( Y| do ( X) ): = P*( Y| X)= ∑UP*( Y| X, U) P*( U| X)= ∑UP*( Y| X, U) P*( U)= ∑UP( Y| X, U) P( U)
La derivazione della porta d'ingresso è un po 'più elaborata. Per prima cosa nota che non c'è confusione tra e , quindi,ZXZ
P( Z| do ( X) ) = P( Z| X)
Inoltre, usando la stessa logica per derivare vediamo che controllare per è sufficiente per derivare l'effetto di su , cioèX Z YP( Y| do ( X) )XZY
P( Y| do ( Z) ) = ∑X'P( Y| X', Z) P( X')
Dove sto usando il primo per comodità di notazione per la prossima espressione. Quindi queste due espressioni sono già in termini di distribuzione pre-intervento e abbiamo semplicemente usato la precedente logica backdoor per ricavarle.
L'ultimo pezzo abbiamo bisogno è inferire l'effetto di su combinando l'effetto di sulla e su . Per farlo, nota nel nostro grafico , poiché l'effetto di su è completamente mediata da e il percorso backdoor da a viene bloccata quando intervenendo su . Quindi:Y Z Y X Z P ( Y | Z , d o ( X ) ) = P ( Y | d o ( Z ) , d o ( X ) ) = P ( Y | d o ( Z ) ) X Y Z Z Y XXYZYXZP( Y| Z, do ( X) ) = P( Y| do ( Z) , do ( X) ) = P( Y| do ( Z) )XYZZYX
P( Y| do ( X) )= ∑ZP( Y| Z, do ( X) ) P( Z| do ( X) )= ∑ZP( Y| do ( Z) ) P( Z| do ( X) )= ∑ZΣX'P( Y| X', Z) P( X') P( Z| X)= ∑ZP( Z| X) ∑X'P( Y| X', Z) P( X')
Dove può essere compreso nel modo seguente: quando intervengo su , la distribuzione di cambia in ; ma in realtà sto intervenendo su quindi voglio sapere con quale frequenza assumerebbe un valore specifico quando cambio , che è .Z Y P ( Y | d o ( Z ) ) X Z X P ( Z | d o ( X ) )ΣZP( Y| do ( Z) ) P( Z| do ( X) )ZYP( Y| do ( Z) )XZXP( Z| do ( X) )
Quindi, i due aggiustamenti ti danno la stessa distribuzione post-interventistica su questo grafico, come abbiamo mostrato.
Rileggendo la tua domanda mi è venuto in mente che potresti essere interessato a mostrare direttamente che il lato destro delle due equazioni è uguale nella distribuzione pre-interventistica (che devono essere, data la nostra precedente derivazione). Non è difficile mostrarlo anche direttamente. Basta dimostrare che nel tuo DAG:
ΣX'P( Y| Z, X') P( X') = ∑UP( Y| Z, U) P( U)
Si noti che il DAG implica e quindi:U ⊥ Z | XY⊥ X| U, ZU⊥ Z| X
ΣX'P( Y| Z, X') P( X')= ∑X'( ∑UP( Y| Z, X', U) P( U| Z, X') ) P( X')= ∑X'( ∑UP( Y| Z, U) P( U| X') ) P( X')= ∑UP( Y| Z, U) ∑X'P( U| X') P( X')= ∑UP( Y| Z, U) P( U)
Quindi:
ΣZP( Z| X) ∑X'P( Y| X', Z) P( X')= ∑ZP( Z| X) ∑UP( Y| Z, U) P( U)= ∑UP( U) ∑ZP( Y| Z, U) P( Z| X)= ∑UP( U) ∑ZP( Y| Z, X, U) P( Z| X, U)= ∑UP( Y| X, U) P( U)