Un probabilistico strutturali causale Model (SCM) è definita come una tupla dove U è un insieme di variabili esogene, V un insieme di variabili endogene, F è un insieme di equazioni strutturali che determina i valori di ciascuna variabile endogena e P ( U ) una distribuzione di probabilità sul dominio di UM=⟨U,V,F,P(U)⟩UVFP(U)U .
In uno SCM rappresentiamo l'effetto di un intervento su una variabile da un sottomodello M x = ⟨ U , V , F x , P ( U ) ⟩ dove F x indica che l'equazione strutturale per X è sostituita dalla nuova equazione interventistica . Ad esempio, l'intervento atomico di impostazione della variabile X su un valore specifico x --- solitamente indicato con d o ( X = x ) --- consiste nella sostituzione dell'equazione per XXMx=⟨U,V,Fx,P(U)⟩FxXXxdo(X=x)X con l'equazione .X=x
Per chiarire le idee, immagina un modello causale strutturale non parametrico definito dalle seguenti equazioni strutturali:M
Z=UzX=f(Z,Ux)Y=g(X,Z,Uy)
Dove i disturbi hanno una qualche distribuzione di probabilità P ( U ) . Ciò induce una distribuzione di probabilità sulle variabili endogene P M ( Y , Z , X ) , e in particolare una distribuzione condizionale di Y dato X , P M ( Y | X ) .UP(U)PM(Y,Z,X)YXPM(Y|X)
PM(Y|X)YXMYXxYMx :
Z= UzX= xY= g( X, Z, Uy)
Cioè, la probabilità interventistica di Y se impostiamo X= x è dato dalla probabilità indotta nel sottomodello MX, questo è, PMX( Y| X= x ) and it's usually denoted by P(Y|do(X=x)). The do(X=x) operator makes it clear we are computing the probability of Y in a submodel where there is an intervention setting X equal to x, which corresponds to overriding the structural equation of X with the equation X=x.
The goal of many analyses is to find how to express the interventional distribution P(Y|do(X)) in terms of the joint probability of the observational (pre-intervention) distribution.
do-calculus
The do-calculus is not the same thing as the do(⋅) operator. The do-calculus consists of three inference rules to help "massage" the post-intervention probability distribution and get P(Y|do(X)) in terms of the observational (pre-intervention) distribution. Hence, instead of doing derivations by hand, such as in this question, you can let an algorithm perform the derivations and automatically give you a nonparametric expression for identifying your causal query of interest (and the do-calculus is complete for recursive nonparametric structural causal models).