Indipendenza statistica significa mancanza di causalità?


40

Due variabili casuali A e B sono statisticamente indipendenti. Ciò significa che nel DAG del processo: e ovviamente . Ma questo significa anche che non c'è porta d'ingresso dalla B alla A?P ( A | B ) = P ( A )(AB)P(A|B)=P(A)

Perché allora dovremmo ottenere . Quindi, se è così, l'indipendenza statistica significa automaticamente mancanza di causalità?P(A|do(B))=P(A)

Risposte:


37

Quindi, se è così, l'indipendenza statistica significa automaticamente mancanza di causalità?

No, ed ecco un semplice contro esempio con un normale multivariato,

set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)

Con il grafico corrispondente,

inserisci qui la descrizione dell'immagine

Qui abbiamo che ed sono marginalmente indipendente (nel caso normale multivariata correlazione nulla implica indipendenza). Ciò accade perché il percorso backdoor tramite annulla esattamente il percorso diretto da a , ovvero . Pertanto . Tuttavia, causa direttamente e abbiamo che , che è diverso da .y z x y c o v ( x , y ) = b - a c = 0.1 - 0.1 = 0 E [ Y | X = x ] = E [ Y ] = 0 x y E [ Y | d o ( X = x ) ] = b x E [ Y ]xyzxycov(x,y)=bac=0.10.1=0E[Y|X=x]=E[Y]=0xyE[Y|do(X=x)]=bxE[Y]=0

Associazioni, interventi e controfattuali

Penso che sia importante fare alcuni chiarimenti qui riguardo ad associazioni, interventi e controfattuali.

I modelli causali comportano affermazioni sul comportamento del sistema: (i) in osservazioni passive, (ii) in interventi, nonché (iii) controfattuali. E l'indipendenza a un livello non si traduce necessariamente in un altro.

Come mostra l'esempio sopra, non possiamo avere alcuna associazione tra e , cioè , e può comunque essere il caso che le manipolazioni su cambino la distribuzione di , cioè .Y P ( Y | X ) = P ( Y ) X Y P ( Y | d o ( x ) ) P ( Y )XYP(Y|X)=P(Y)XYP(Y|do(x))P(Y)

Ora possiamo fare un ulteriore passo avanti. Possiamo avere modelli causali in cui intervenire su non cambia la distribuzione della popolazione di , ma ciò non significa mancanza di causalità controfattuale! Cioè, anche se , per ogni individuo il loro esito sarebbe stato diverso se si è modificato il suo . Questo è precisamente il caso descritto da user20160, così come nella mia precedente risposta qui.Y P ( Y | d o ( x ) ) = P ( Y ) Y XXYP(Y|do(x))=P(Y)YX

Questi tre livelli formano una gerarchia di compiti di inferenza causale , in termini di informazioni necessarie per rispondere alle domande su ciascuno di essi.


1
Grazie, è esattamente quello che stavo cercando. Quindi immagino che la mia confusione sia stata causata (nessun gioco di parole intenzionale) dal pensare che l'indipendenza statistica significhi anche una separazione D tra le due variabili. Ma funziona solo al contrario, giusto?
user1834069

@ user1834069 esatto, la separazione D implica l'indipendenza, ma l'indipendenza non implica la separazione D. Questi due sono esempi in cui la distribuzione è infedele al grafico e puoi vederlo dipende dalla scelta della parametrizzazione. Se cambiamo i parametri, la dipendenza si presenta di nuovo.
Carlos Cinelli,

Bell'esempio Se ricordo bene, questa è una delle ipotesi non verificabili del mining data mining causale da dati osservativi. Per i modelli lineari in SEM, il libro di Pearl menziona anche che l'insieme di coefficienti che danno luogo a una distribuzione infedele è di misura 0.
Vimal,

37

Supponiamo di avere una lampadina controllata da due interruttori. Lascia che e denotino lo stato degli switch, che può essere 0 o 1. Sia denota lo stato del lighbulb, che può essere 0 (off) o 1 (on). Abbiamo impostato il circuito in modo tale che la lampadina sia accesa quando i due interruttori sono in stati diversi e spenta quando sono nello stesso stato. Quindi, il circuito implementa l'esclusiva o la funzione: .S 2 L L = XOR ( S 1 , S 2 )S1S2LL=XOR(S1,S2)

Per costruzione, è causalmente correlato a e . Data qualsiasi configurazione del sistema, se si attiva un interruttore, lo stato della lampadina cambierà.S 1 S 2LS1S2

Supponiamo ora che entrambi gli interruttori siano azionati indipendentemente secondo un processo di Bernoulli, dove la probabilità di trovarsi nello stato 1 è 0,5. Quindi, e e sono indipendenti. In questo caso, sappiamo dalla progettazione del circuito che e, inoltre, . Cioè, conoscere lo stato di un interruttore non ci dice nulla sul fatto che il lighbulb sarà acceso o spento. Quindi e sono indipendenti, così come e .S 1 S 2 P ( L = 1 ) = 0,5 p ( L S 1 ) = p ( L S 2 ) = p ( L ) L S 1 L S 2p(S1=1)=p(S2=1)=0.5S1S2P(L=1)=0.5p(LS1)=p(LS2)=p(L)LS1LS2

Ma, come sopra, è causalmente correlato a e . Pertanto, l'indipendenza statistica non implica la mancanza di causalità.S 1 S 2LS1S2


2
utente, hai ragione che questo esempio ha una causalità con mancanza di dipendenza, come spiego qui stats.stackexchange.com/questions/26300/… , tuttavia in questo esempio abbiamo anche che , quindi non risponde direttamente alla domanda del PO. P(L|do(S1))=P(L)
Carlos Cinelli,

utente, domanda per favore: che dire di ? Vale a dire è uguale anche a ? Personalmente penso, per qualsiasi , , ma . Ho ragione? (Vedo che non è realmente correlato, ma voglio ricontrollare la mia comprensione)p(L|S1,S2)p(L)(vL,v1,v2){0,1}3p(L=vL|S1=v1)=p(L=vL|S2=v2)=0.5 p(L=vL|S1=v1,S2=v2){0,1}
uomo delle caverne

0

Sulla base della tua domanda, puoi pensare in questo modo:

P(AB)=P(A)P(B) quando e sono indipendenti. Allo stesso modo puoi implicareAB

P(AB)/P(A)=P(B|A)=P(B) . Anche,

P(AB)/P(B)=P(A|B)=P(A) .

A questo proposito, credo che l'indipendenza significhi mancanza di causalità. Tuttavia, la dipendenza non implica necessariamente la causalità.


2
P(AB)=P(A)P(B)P(A|do(B))=P(A)
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.